स्काइप ट्रांसलेटर कैसे काम करता है

विषयसूची:
- तकनीक जो इसे संभव बनाती है
- कुछ सेकंड में बोली जाने वाली एक भाषा से दूसरी भाषा में
- शुरुआती बिंदु के रूप में परीक्षण कार्यक्रम
विज्ञान कथा तकनीकी रूप से उन्नत उपकरणों के संदर्भों से भरी हुई है, जिसका संचालन, पौराणिक अभिव्यक्ति को समझने के लिए, जादू से अप्रभेद्य है। उनके लेखकों के रचनात्मक दिमाग से उत्पन्न, यह कल्पना करना कठिन है कि कब ऐसे आविष्कार हमारे हाथ में आ सकते हैं और हम यह स्वीकार कर लेते हैं कि उनका अस्तित्व हमारे जीवन चक्र का हिस्सा नहीं बनेगा। लेकिन हर बार उनमें से एक समय से पहले हमारे जीवन में घुस जाता है। यह रियल-टाइम अनुवाद का मामला है जिसे Microsoft और Skype संभव बनाने जा रहे हैं
"काम कुछ भी हो लेकिन आसान है।इसमें स्काइप की वीडियो कॉन्फ़्रेंस की क्षमता, Microsoft Azure के क्लाउड सर्वरों का विशाल नेटवर्क, Microsoft रिसर्च के तकनीकी नवाचार, और सांख्यिकी और मशीन लर्निंग जैसे कई क्षेत्रों में हाल की प्रगति शामिल है। यह सब आपकी सेवा में लगा दिया गया है ताकि जैसे ही आप अपनी भाषा में एक वाक्य का उच्चारण करते हैं, सिस्टम आप जो कहते हैं उसे पहचानता है, इसका अनुवाद करता है और इसे किसी दूसरी भाषा में आपके संपर्क में भेजता है। यह कैसे संभव है?"
तकनीक जो इसे संभव बनाती है
Skype Translator, जिस नाम से नई कार्यक्षमता जानी जाती है, वह पैन में फ्लैश नहीं है, एक साल में भी नहीं . स्काइप ट्रांसलेटर वाक् पहचान, मशीन अनुवाद और मशीन लर्निंग तकनीकों में दशकों के शोध का परिणाम है। इन सभी क्षेत्रों में एक ऐसी प्रणाली का संचालन है जो उनमें नवीनतम प्रगति के बिना संभव नहीं होता।
स्काइप ट्रांसलेटर स्पीच रिकग्निशन, मशीन ट्रांसलेशन और मशीन लर्निंग तकनीक में दशकों के शोध का परिणाम है।से शुरू होकर बोलने की पहचान, एक ऐसी तकनीक जो कुछ समय से जांच के दायरे में है लेकिन जिसे अपनाने से हमेशा बड़ी संख्या प्रभावित होती रही है त्रुटियों और मौजूदा प्रणालियों की अत्यधिक संवेदनशीलता। एक सेकंड का संदेह, उच्चारण में छोटे बदलाव, या न्यूनतम शोर कंप्यूटर को भ्रमित करने और यह समझने के लिए पर्याप्त था कि वह क्या चाहता है। जब तक 'डीप लर्निंग' तकनीकों का विकास और कृत्रिम तंत्रिका नेटवर्क का निर्माण नहीं हुआ, तब तक ऐसा ही था, जिसके बारे में Microsoft अनुसंधान कुछ जानता है। उनके लिए धन्यवाद, त्रुटि दर को काफी कम करना और भाषण पहचान की विश्वसनीयता और मजबूती में सुधार करना संभव हो गया है, स्काइप ट्रांसलेटर के काम करने के लिए एक आवश्यक पहला कदम है।
मशीन अनुवाद अन्य स्पष्ट स्तंभ है जिस पर स्काइप अनुवादक टिका हुआ है। यहाँ Microsoft एक बार फिर इन-हाउस तकनीक का उपयोग करता है और पाठ को एक भाषा से दूसरी भाषा में अनुवाद करने के लिए बिंग अनुवाद इंजन का उपयोग करता है।उनकी प्रणाली परिणाम को परिष्कृत करने के लिए सिंटैक्स पहचान तकनीकों और सांख्यिकीय मॉडल के संयोजन का उपयोग करती है। इसके अलावा, इस अवसर पर, इंजन को विशेष रूप से प्रशिक्षित किया गया है कि वह बोली जाने वाली बातचीत में होने वाली भाषा के प्रकार को पहचानने के लिए, शुद्धता और साफ-सफाई से बहुत दूर है जो आमतौर पर लिखित रूप में माना जाता है। इस प्रकार, स्काइप ट्रांसलेटर सिस्टम बिंग ट्रांसलेटर के विशाल भाषा ज्ञान के आधार को आम बोलचाल की भाषा में आमतौर पर इस्तेमाल होने वाले शब्दों और वाक्यांशों की एक विस्तृत परत के साथ जोड़ती है।
लेकिन बोली और भाषाएं जटिल क्षेत्र हैं। वे लगातार बदलते रहते हैं, वे कई स्वादों और किस्मों में आते हैं, प्रत्येक व्यक्ति की अपनी विशेष शैली होती है, आदि। स्काइप ट्रांसलेटर को इन सबके साथ तालमेल बिठाना पड़ता है, जिसके लिए वाक् पहचान और मशीन अनुवाद दोनों के लिए निरंतर प्रशिक्षण और अनुकूलन की आवश्यकता होती है। ऐसा करने के लिए सिस्टम को एक मजबूत 'मशीन लर्निंग' प्लेटफॉर्म पर बनाया गया है, आर्टिफिशियल इंटेलिजेंस की एक शाखा जिसका उद्देश्य ऐसी तकनीक विकसित करना है जो मशीनों और एल्गोरिदम को सीखने की अनुमति देती है नमूना डेटा के साथ प्रशिक्षण द्वारा।इन तकनीकों का उपयोग, सांख्यिकी के क्षेत्र में आम है, सेवा को बेहतर बनाने की अनुमति देता है क्योंकि इसका उपयोग किया जाता है, वाक् पहचान और स्वचालित अनुवाद को और परिष्कृत करने के लिए इसका उपयोग करते समय उत्पन्न डेटा का लाभ उठाते हुए।
इस परीक्षण डेटा में से कुछ सामाजिक नेटवर्क जैसे फेसबुक, अनुवादित वेब पेज, उपशीर्षक के साथ वीडियो, या यहां तक कि इस उद्देश्य के लिए बनाई गई बातचीत और लिखित और मैन्युअल रूप से अनुवाद सहित विभिन्न प्रकार के स्रोतों से स्वचालित रूप से उत्पन्न होता है . लेकिन डेटा का एक अन्य हिस्सा सेवा के माध्यम से हुई वास्तविक बातचीत से आता है। यह महत्वपूर्ण है क्योंकि, जैसा कि Microsoft आपको प्रत्येक कॉल के साथ सूचित करता है, आपको पता होना चाहिए कि Skype Translator बातचीत को रिकॉर्ड कर सकता है, उन्हें गुमनाम रख सकता है, ताकि बाद में इसके एल्गोरिदम द्वारा उनका विश्लेषण किया जा सके और उनके सांख्यिकीय मॉडल की प्रशिक्षण प्रक्रिया में पेश किया गया।
Skype अनुवादक केवल तभी ठीक से काम कर सकता है जब वह वास्तविक मानव वार्तालापों में इसके उपयोग के आधार पर एक प्रक्रिया के माध्यम से सीखने में सक्षम हो
"इस सीखने की प्रक्रिया के बिना सिस्टम काम नहीं कर सकता। जब मनुष्य बोलते हैं तो हम चीजों को रोकते हैं और दोहराते हैं, गलतियाँ करते हैं और अपनी सोच को बदलते हैं जैसे हम चलते हैं, ahs, ehms, uhms> का परिचय देते हुए केवल इसके वास्तविक उपयोग के बारे में सीखना ही इसे बेहतर बना सकता है "
कुछ सेकंड में बोली जाने वाली एक भाषा से दूसरी भाषा में
इन सभी अग्रिमों द्वारा समर्थित, कुंजी यह है कि स्काइप ट्रांसलेटर उपयोगकर्ता के लिए पूरी पहचान और अनुवाद प्रक्रिया को जल्दी और पारदर्शी रूप से निष्पादित करने में सक्षम है हर बार जब हम बोलते हैं, तो सिस्टम को यह समझना चाहिए कि हम क्या कह रहे हैं, इसे प्राप्तकर्ता की भाषा में अनुवादित करें और इसे इस तरह से संप्रेषित करें जो उस बात के प्रति वफादार रहे जो हम शुरू में संवाद करने की कोशिश कर रहे थे।मध्यवर्ती चरणों पर हम जितना कम ध्यान दें, उतना ही अच्छा है।
जैसे ही सिस्टम को पता चलता है कि हम बोल रहे हैं, यह हम जो कहते हैं उसे रिकॉर्ड करना शुरू कर देता है और बोली पहचानने की प्रक्रिया शुरू कर देता है यह नहीं है न केवल प्रत्येक शब्द को पहचानने के बारे में जिसका हम उच्चारण कर रहे हैं, बल्कि सभी अनावश्यक को खत्म करने, अर्थहीन अभिव्यक्तियों और शोर को हटाने, वाक्यों में पाठ के विभाजन का पता लगाने, विराम चिह्नों और बड़े अक्षरों के समावेश के साथ, और इसे एक संदर्भ प्रदान करने के बारे में जो आपकी व्याख्या में मदद करता है। जब आप इसके बारे में थोड़ा सोचते हैं, तो आप महसूस करते हैं कि बोली जाने वाली भाषा से यह सब निर्धारित करना कितना मुश्किल है।
Skype अनुवादक को वाक् पहचान को यथासंभव सटीक होने की आवश्यकता होती है, क्योंकि इसके बाद संग्रहीत जानकारी को सुधार रहे सांख्यिकीय मॉडल के साथ तुलना करने के लिए तैयार किया जाता है अपने 'मशीन लर्निंग' सिस्टम के ज़रिए.यहाँ इस प्रक्रिया में सिस्टम द्वारा समझी गई बातों और मॉडलों में निहित शब्दों और संदर्भों के बीच समानताएं खोजने की प्रक्रिया शामिल है, ताकि बाद में पहले से सीखे गए परिवर्तनों को लागू किया जा सके जो ऑडियो को पाठ में परिवर्तित करेगा और इसे विदेशी भाषा में अनुवादित करेगा।
आखिरी चरण में, स्काइप ने बॉट्स का एक जोड़ा तैयार किया है, जिसमें महिला और पुरुष आवाजें हैं, जो कॉल में दुभाषियों के रूप में काम करते हैं उपयोगकर्ता द्वारा एक बार चुने जाने के बाद, वह हमारे अनुवादित संदेश को रिसीवर तक पहुंचाने का प्रभारी होगा, ताकि न केवल लिखित ट्रांसक्रिप्शन और अनुवाद स्क्रीन पर दिखाई दें, बल्कि वह उन्हें ज़ोर से भी सुन सके जैसे कि कोई तीसरा इंसान हो हमारे बीच मध्यस्थता.. ये बॉट संदेश को शीघ्रता से संप्रेषित करने में सक्षम हैं, ताकि जो कोई भी स्क्रीन के दूसरी तरफ सुन रहा है, वह हमारे उच्चारण के कुछ सेकंड बाद संदेश प्राप्त कर ले।
शुरुआती बिंदु के रूप में परीक्षण कार्यक्रम
संक्षिप्त रूप से वार्तालाप में तीसरे पक्ष के वक्ता के रूप में बॉट्स की उपस्थिति उन विवरणों में से एक है जिसे अभी भी परिष्कृत किया जाना बाकी है। Microsoft मानता है कि दुभाषिया के माध्यम से बोलने के आदी लोगों के लिए उन्हें अपनाना आसान है, लेकिन दूसरों के लिए इसे सीखने की अवधि की आवश्यकता होती है। और यह है कि माइक्रोसॉफ्ट और स्काइप सबसे अच्छा रीयल-टाइम अनुवाद अनुभव बनाने के लिए दृढ़ संकल्पित हो सकते हैं, लेकिन ऐसा करने के लिए उन्हें खुद और मशीनों दोनों को सीखने की जरूरत हैस्काइप ट्रांसलेटर पूर्वावलोकन उस प्रक्रिया में बस एक और चरण है।
परीक्षण कार्यक्रम दिसंबर के मध्य में शुरू हुआ, दो भाषाओं के बीच बोली जाने वाली अनुवाद: अंग्रेजी और स्पेनिश, और 40 से अधिक में लिखित अनुवाद इसे एक्सेस करने के लिए एक आमंत्रण आवश्यक है, जिसे हम प्रोग्राम की वेबसाइट पर रजिस्टर करके अनुरोध कर सकते हैं। यदि हम इसके साथ अनुग्रहित हैं तो हम विंडोज 8 के लिए स्काइप एप्लिकेशन से स्काइप ट्रांसलेटर का प्रयास कर सकते हैं।1 या विंडोज 10 तकनीकी पूर्वावलोकन। अन्यथा हमें सेवा के विस्तार और आधिकारिक तौर पर सार्वजनिक किए जाने की प्रतीक्षा करनी होगी।
"खैर, Skype Translator ने ठीक वैसे ही काम करना शुरू कर दिया है जैसे हम 2014 को अलविदा कहने वाले हैं. समाप्त करने से पहले, यहां एक सेकंड के लिए रुकें और उस वर्ष के बारे में सोचें जिसे आपने अभी पढ़ा है: दो हजार चौदह>"
वाया | स्काइप ब्लॉग I, II