प्रसंग:
‘अटेंशन इज़ ऑल यू नीड’ नामक एक अग्रणी पेपर में, Google की एक टीम ने ट्रांसफॉर्मर प्रस्तावित किया – एक गहरा तंत्रिका नेटवर्क आर्किटेक्चर जिसने आज सभी तौर-तरीकों में लोकप्रियता हासिल की है।
मशीन लर्निंग (एमएल) के बारे में:
- यह है एक कृत्रिम बुद्धि का उपक्षेत्र जो कंप्यूटर को इनपुट और वांछित आउटपुट के उदाहरण प्रदान करके संरचित डेटा, भाषा, ऑडियो या छवियों के आधार पर कार्यों को हल करना सिखाता है।
- उदाहरण के लिए:
-
- में मूलपाठ, किसी दस्तावेज़ को वैज्ञानिक या साहित्यिक के रूप में वर्गीकृत करने से कुछ शब्दों के प्रकट होने की संख्या की गणना करके हल किया जा सकता है।
- में ऑडियोबोले गए पाठ को ऑडियो को समय आवृत्ति प्रतिनिधित्व में परिवर्तित करके पहचाना जाता है।
- में इमेजिस, विशिष्ट कार जैसे किनारे के आकार के पैटर्न के अस्तित्व की जाँच करके एक कार को पाया जा सकता है।
डीप न्यूरल नेटवर्क क्या है?
- गहन शिक्षण तंत्रिका नेटवर्क, या कृत्रिम तंत्रिका नेटवर्क, प्रयास मानव मस्तिष्क की नकल करने के लिए डेटा इनपुट, वज़न और पूर्वाग्रह के संयोजन के माध्यम से
- ये तंत्रिका नेटवर्क हैं जो प्रयास करते हैं मानव मस्तिष्क के व्यवहार का अनुकरण करने के लिए– यद्यपि इसकी क्षमता से मेल खाने से बहुत दूर – इसे बड़ी मात्रा में डेटा से “सीखने” की अनुमति देता है
- यह कई नोड्स के होते हैं जो सिस्टम के छोटे हिस्से हैं, और वे मानव मस्तिष्क के न्यूरॉन्स की तरह हैं।
चित्र: गहरा तंत्रिका नेटवर्क
- जब कोई उद्दीपन उन पर प्रहार करता है, तो इन गांठों में एक प्रक्रिया होती है। उनमें से कुछ जुड़े और चिह्नित हैं, और कुछ नहीं हैं, लेकिन सामान्य तौर पर, नोड्स को परतों में समूहीकृत किया जाता है।
- किसी कार्य को हल करने के लिए सिस्टम को इनपुट और आउटपुट के बीच डेटा की परतों को प्रोसेस करना चाहिए।
- परिणाम प्राप्त करने के लिए जितनी अधिक परतों को संसाधित करना पड़ता है, उतना ही गहरा नेटवर्क माना जाता है।
- DNN एक पूर्ण दस्तावेज़ या छवि को निगलना और एक अंतिम आउटपुट उत्पन्न करते हैं, बिना सुविधाओं को निकालने के किसी विशेष तरीके को निर्दिष्ट करने की आवश्यकता के बिना।
एक ट्रांसफार्मर क्या है?
- एक ट्रांसफॉर्मर एक दो भाग तंत्रिका नेटवर्क है।
- पहला भाग एक है ‘एनकोडर’ जो इनपुट वाक्य को स्रोत भाषा (उदाहरण- अंग्रेजी) में शामिल करता है और दूसरा भाग है a ‘डिकोडर’ जो लक्षित भाषा में अनुवादित वाक्य उत्पन्न करता है (उदाहरण- हिंदी)।
- एनकोडर प्रत्येक शब्द को स्रोत वाक्य में एक अमूर्त संख्यात्मक रूप में परिवर्तित करता है जो शब्द के अर्थ को वाक्य के संदर्भ में कैप्चर करता है, और इसे मेमोरी बैंक में संग्रहीत करता है।
- कूटवाचक एक समय में एक शब्द उत्पन्न करता है जो अब तक उत्पन्न हुआ है और उचित शब्द खोजने के लिए मेमोरी बैंक को देखकर।
- ये दोनों प्रक्रियाएं एक तंत्र का उपयोग करती हैं जिसे कहा जाता है ध्यान।
- सुधार: पिछले तरीकों की तुलना में एक महत्वपूर्ण सुधार लंबे वाक्यों या पैराग्राफों का सही ढंग से अनुवाद करने के लिए ट्रांसफॉर्मर की क्षमता है। ट्रांसफॉर्मर को अपनाने के बाद विस्फोट हो गया। उदाहरण के लिए, चैटजीपीटी में कैपिटल ‘टी’ का अर्थ ‘ट्रांसफॉर्मर’ है।
- कंप्यूटर दृष्टि में प्रयोग करें:
-
- ट्रांसफार्मर भी हैं कंप्यूटर दृष्टि में लोकप्रिय बनें जैसा कि वे एक छवि को छोटे चौकोर पैच में काटते हैं और उन्हें एक वाक्य में शब्दों की तरह पंक्तिबद्ध करते हैं।
- आज, ट्रांसफॉर्मर मॉडल सबसे अच्छा तरीका बनाते हैं छवि वर्गीकरण, वस्तु का पता लगाने और विभाजन, क्रिया पहचान, और कई अन्य कार्यों के लिए।
- ट्रांसफार्मर की कुछ भी निगलने की क्षमता संयुक्त दृष्टि और भाषा मॉडल बनाने के लिए उपयोग किया गया है जो उपयोगकर्ताओं को एक छवि (जैसे, Google छवि खोज) की खोज करने, एक का वर्णन करने और यहां तक कि छवि के बारे में सवालों के जवाब देने की अनुमति देता है।
- ट्रांसफार्मर से संबंधित चिंताएँ:
-
- वैज्ञानिक समुदाय को अभी यह पता लगाना है कि इन मॉडलों का कठोरता से मूल्यांकन कैसे किया जाए।
- वे भी हैं “मतिभ्रम” के उदाहरणजिससे मॉडल आत्मविश्वासी लेकिन गलत दावे करते हैं।
- डेटा की निजता और रचनात्मक कार्यों को श्रेय देने जैसी सामाजिक चिंताओं को दूर करने की तत्काल आवश्यकता है, जो उनके उपयोग के परिणामस्वरूप उत्पन्न होती हैं।
‘ध्यान’ क्या है?
- एमएल में ध्यान एक मॉडल को यह सीखने की अनुमति देता है कि विभिन्न इनपुट्स को कितना महत्व दिया जाना चाहिए।
- अनुवाद में उपयोग: अटेन्शन मॉडल को स्मृति बैंक से शब्दों का चयन करने या तौलने की अनुमति देता है, जब यह तय करता है कि कौन सा शब्द अगला उत्पन्न करना है।
- छवि विवरण में उपयोग: ध्यान मॉडल को अगला शब्द उत्पन्न करते समय छवि के प्रासंगिक भागों को देखने की अनुमति देता है।
- ट्रांसफ़ॉर्मर्स में एनकोडर के भीतर कई ध्यान देने वाली परतें होती हैं, इनपुट वाक्य या छवि में सार्थक संदर्भ प्रदान करने के लिए, और डिकोडर से एनकोडर तक अनुवादित वाक्य उत्पन्न करते समय या एक छवि का वर्णन करते समय।
खबर के सूत्र: हिन्दू
पोस्ट ट्रांसफॉर्मर- मशीन लर्निंग मॉडल सबसे पहले UPSCTyari पर दिखाई दिया।