माइक्रोसॉफ्ट रिसर्च स्वचालित रूप से "स्मार्ट" कैप्शन उत्पन्न करने में सक्षम प्रणाली बनाता है

विषयसूची:
निश्चित रूप से आपने एक ऐसा कैप्शन देखा है जो भ्रमित करने वाला, गलत है या उस छवि के बारे में कुछ नहीं कहता है जिसका वह संदर्भ देता है; और यह भी संभव है कि, यदि आप अपने स्वयं के लेखों को प्रकाशित करने के लिए स्वयं को समर्पित करते हैं, तो आप इस अनुभाग को भरने के लिए थकाऊ पाते हैं। खैर, रेडमंड के लोगों ने एक टूल बनाया है जिसका उद्देश्य आपके लिए चीजों को आसान बनाना है।
माइक्रोसॉफ्ट रिसर्च द्वारा प्रकाशित एक काम जो खुद को "कैप्शन जेनरेशन सिस्टम" के रूप में वर्णित करता है, जो मानव भाषा की वर्णनात्मक विशेषताओं की नकल करने में सक्षम है, यानी एक ऐसी तकनीक जो स्क्रीनशॉट का वर्णन कर सकती है जैसे कि हम में से कोई एक, इसके संगत संदर्भ के साथ।कुछ ऐसा जिस पर फेसबुक, माइक्रोसॉफ्ट और गूगल जैसी कंपनियां कुछ समय से काम कर रही हैं, लेकिन इस बार यह अपेक्षाओं से अधिक है।
इसमें क्या शामिल होता है
इस तरह, system कई छवियों से एक पूरी कहानी भी बताने की क्षमता रखता है, इसका वर्णन करता है और इसे इस तरह बताता है यह एक किताब थी। एक उपयोगिता, जो विशेषज्ञों के अनुसार, एक ऐसी सुविधा बन सकती है जो कुछ अनुप्रयोगों, ध्वनि पहचान अनुप्रयोगों, स्वचालित रूप से अन्य क्षेत्रों में विवरण उत्पन्न करने और बहुत कुछ के लिए अधिक मानवीय स्पर्श प्रदान करती है।
तथ्य यह है कि tool संक्षेप में यह कहने तक सीमित नहीं है कि यह "देखता है", बल्कि एक व्यापक प्रदान करता है इस काम के लेखकों में से एक, फ्रैंक फेरारो ने समझाया, "कथात्मक संदर्भ और वर्णन की अनूठी शैली" को प्राप्त करने वाली स्थिति का संदर्भ छवि में परिलक्षित होता है।खुद को एक स्थिति में रखने के लिए, वह हमें स्पष्ट example देता है
इस प्रकार, हम प्रस्तावनिम्नलिखित मामले में: “आइए कल्पना करें कि हमारे पास कुछ दोस्तों का एक फोटो एलबम है जिन्होंने एक जन्मदिन मनाया है पब। पहली तस्वीरों में से कुछ में लोगों को बीयर ऑर्डर करते और पीते हुए दिखाया गया है, जबकि आखिरी में किसी को सोफ़े पर सोते हुए दिखाया गया है", उन्होंने टिप्पणी की।
पारंपरिक प्रणाली "बस कुछ इस तरह इंगित कर सकती है जैसे कोई व्यक्ति सोफे पर लेटा है, जबकि हमारी प्रणाली में यह शामिल हो सकता है कि वे शायद उस स्थिति में हैं क्योंकि वे कुछ पेय पीने के बाद नशे में हैं"। एक अतिरिक्त जो समझ प्रदान करता है और एक निश्चित भावनात्मक आवेश जो इस लेख में शामिल छवियों और फोटो कैप्शन के माध्यम से भी परिलक्षित होता है।
वाया | एमआईटी प्रौद्योगिकी समीक्षा
Xataka विंडोज़ में | Microsoft ने एक ऐप लॉन्च किया जो आपके कुत्ते की नस्ल निर्धारित करता है