काठमाडौँ । गत सेप्टेम्बरमा ओपनएआईले च्याटजीपीटीको नयाँ भर्सन ल्यायो । उक्त भर्सनसँगै यसलाई गणित, विज्ञान र कम्प्युटर प्रोग्रामिङका काममा सोचविचार अर्थात् ‘थिङ्किङ’ गर्न सक्ने बनाइएको थियो । पहिलेका भर्सनभन्दा फरक यस प्रविधिले जटिल समस्यामा उत्तर दिनुअघि ‘सोच्न’ समय लगाउन सक्थ्यो ।
कम्पनीले उसको नयाँ ‘रिजनिङ’ मोडेल (तर्क गर्ने क्षमता)ले एआईको प्रगति मापन गर्ने विभिन्न परीक्षणमा उद्योगका प्रमुख मोडेलभन्दा राम्रो प्रदर्शन गरेको दाबी गर्यो । अहिले गुगल, एन्थ्रोपिक र चीनको डिपसिक जस्ता अन्य कम्पनीले पनि यस्तै मोडेल उपलब्ध गराइरहेका छन् ।
तर के एआईले साँच्चै मानिस जस्तै सोच्न सक्छ ? कम्प्युटर अथवा एआईले सोच्न सक्छ भन्नुको अर्थ के हो ? के यी प्रणाली साँच्चै वास्तविक बौद्धिकताको नजिक पुग्दैछन् ?
एआई प्रणालीले सोचविचार अर्थात् रिजनिङ गर्छन् भन्नुको अर्थ के हो ?
रिजनिङ गर्नुको अर्थ च्याटबटले प्रयोगकर्ताको जिज्ञासा मेटाउन वा प्रश्नको जवाफ दिन थप समय लगाउनु हो । “प्रश्न सोधिसकेपछि प्रणालीले थप काम गर्नु नै रिजनिङ हो,” क्यालिफोर्निया विश्वविद्यालय, बर्कलीका कम्प्युटर विज्ञानका प्राध्यापक तथा एआई स्टार्टअप स्केल्ड कोग्निसनका प्रमुख प्रविधि अधिकृत ड्यान क्लाइनले भने ।
यसले प्रयोगकर्ताले राखेका प्रश्न, जिज्ञासा वा अन्य कुनै कामलाई विभिन्न चरणमा विभाजन गर्छ । वा, जवाफ दिनुअघि ‘ट्रायल एन्ड इरोर’ प्रक्रिया अपनाउँछ । अनि उपयुक्त जवाफ दिन्छ । ट्रायल एन्ड इरोर प्रोसेस भनेको भनेको कुनै कुरा नमिल्दासम्म विभिन्न उपाय एकपछि अर्को गर्दै प्रयास गरिरहने र गल्तीबाट सिक्दै जाने प्रक्रिया हो ।
पुरानो च्याटजीपीटीले तुरुन्तै जवाफ दिन्थ्यो । नयाँ रिजनिङ मोडेलले जवाफ दिनुअघि केही सेकेन्ड वा मिनेटसम्म समस्यामा काम गर्न सक्छ ।
कहिलेकाहीं रिजनिङ मोडेलले प्रश्नको लागि आफ्नो उत्तर दिने तरिका सुधार्छ । आफूले रोजेको विधि बारम्बार राम्रो बनाउन खोज्छ । कहिलेकाहीं भने यसले एउटा निर्णय गर्नुअघि समस्या समाधानका विभिन्न तरिका अपनाउन सक्छ । वा, केही सेकेन्डअघि गरेको काम सही थियो कि भनेर जाँच्न सक्छ ।
मूलतः यस मोडेलले तपाईंको प्रश्नको उत्तर दिन जे पनि गर्न खोज्छ । जसरी गणितको समस्या समाधान गर्न कागजमा विभिन्न विकल्प कोरेर स्कुले विद्यार्थी समाधान गर्छ त्यसरी नै यस मोडेलले पनि काम गर्छ ।
कस्ता प्रश्नमा एआई प्रणालीले सोचविचार गर्नुपर्छ ?
यसले सम्भावित रूपमा जुनसुकै कुरामा रिजनिङ गर्न सक्छ । तर गणित, विज्ञान र कम्प्युटर प्रोग्रामिङ सम्बन्धी प्रश्नमा रिजनिङ सबैभन्दा प्रभावकारी हुन्छ ।
तपाईं अघिल्लो पुस्ताका च्याटबटलाई उसले कुनै उत्तर कसरी निकाल्यो भन्ने देखाउन वा आफूले गरेको काम फेरी जाँच गर्न भन्न सक्नुहुन्थ्यो । सुरुको च्याटजीपीटीले इन्टरनेटमा उपलब्ध ती वेबपेजबाट सिकेको थियो जहाँ मानिसले आफूले उत्तर कसरी निकालें भन्ने तरिका देखाउने गर्थे वा आफ्नै काम फेरी जाँच गर्थे । त्यसैले च्याटजीपीटीले पनि यस्ता आत्म-समीक्षा गर्ने क्षमता देखाउँथ्यो ।
तर, अहिलेको रिजनिङ मोडेल अझ प्रभावकारी बन्दै गएको छ । यसले यस्ता कुरा तपाईंले नभने पनि आफैं गर्न सक्छ । त्यसका साथै अझ विस्तृत र जटिल तरिकाले सोच्न सक्छ ।
कम्पनीले यसलाई ‘रिजनिङ सिस्टम’ (तार्किक प्रणाली) भन्ने गर्छन् किनभने यस प्रणालीले कुनै गाह्रो समस्या समाधान गर्ने क्रममा मान्छेले सोच्ने तरिका जस्तै महसुस गराउँछ ।
एआई रिजनिङ अहिले किन महत्त्वपूर्ण छ ?
ओपनएआई जस्ता कम्पनी आफ्ना च्याटबट सुधार्ने यो नै उत्तम तरिका हो भन्ने ठान्छन् । वर्षौंसम्म यी कम्पनी एक साधारण अवधारणामा निर्भर थिए । त्यो के भने जति धेरै इन्टरनेट डेटा च्याटबटमा हाल्यो प्रणाली त्यति नै राम्रो हुन्छ भन्ने उनीहरू सोच्थे । तर, २०२४ सम्ममा उनीहरूले इन्टरनेटको लगभग सबै टेक्स्ट प्रयोग गरिसके ।
यसको अर्थ अब उनीहरूलाई आफ्ना च्याटबट सुधार्ने नयाँ तरिका चाहियो । त्यसैले उनीहरूले रिजनिङ गर्ने प्रणाली बनाउन थाले ।
सोचविचार गर्ने प्रणाली कसरी बनाइन्छ ?
गत वर्षदेखि ओपनएआई जस्ता कम्पनी ‘रिइन्फोर्समेन्ट लर्निङ’ नामक प्रविधिमा बढी भर पर्न थालेका छन् । यस प्रक्रिया मार्फत एआई प्रणालीले व्यापक ‘ट्रायल एन्ड इरोर’ पद्दतिबाट व्यवहार सिक्न सक्छ । (ट्रायल एन्ड इरोर प्रोसेस भनेको भनेको कुनै कुरा नमिल्दासम्म विभिन्न उपाय एकपछि अर्को गर्दै प्रयास गरिरहने र गल्तीबाट सिक्दै जाने प्रक्रिया हो ।) उदाहरणका लागि हजारौं गणितीय समस्या समाधान गरेर यसले कुन विधिले सही उत्तर दिन्छ र कुनले दिंदैन भनेर सिक्न सक्छ ।
अनुसन्धानकर्ताले यस्तो ‘जटिल प्रतिक्रिया प्रणाली’ डिजाइन गरेका छन् जसले यस मोडेललाई उसले कहिले सही र कहिले गलत गर्यो भन्ने कुरा देखाउँछ ।
“यो कुकुरलाई तालिम दिएजस्तै हो,” ओपनएआईका अनुसन्धानकर्ता जेरी ट्वोरेकले भने, “यदि प्रणालीले राम्रो गर्यो भने तपाईं उसलाई बिस्कुट दिनुहुन्छ । यदि राम्रो गरेन भने ‘खराब कुकुर’ भन्नुहुन्छ ।”
के रिइन्फोर्समेन्ट लर्निङले काम गर्छ ?
रिइन्फोर्समेन्ट लर्निङले गणित, विज्ञान र कम्प्युटर प्रोग्रामिङ जस्ता केही क्षेत्रमा राम्रोसँग काम गर्छ । यी क्षेत्रमा कम्पनीले राम्रो र नराम्रो व्यवहार स्पष्ट रूपमा परिभाषित गर्न सक्छन् । गणितका समस्याको निश्चित उत्तर हुन्छ ।
तर रिइन्फोर्समेन्ट लर्निङले रचनात्मक लेखन, दर्शन र नैतिकता जस्ता क्षेत्रमा त्यति प्रभावकारी काम गर्दैन । किनभने त्यस क्षेत्रमा राम्रो र नराम्रो बीचको भिन्नता छुट्याउन गाह्रो हुन्छ । अनुसन्धानकर्ताका अनुसार यस प्रक्रियाले सामान्यतः एआई प्रणालीको कार्यक्षमता सुधार गर्न सक्छ । गणित र विज्ञानसँग सम्बन्धित प्रश्नको उत्तर मात्र नभई त्यसबाहेकका क्षेत्रमा पनि यस सिस्टमले काम गर्न सक्ने उनीहरू ठान्छन् । “कुन सोचाइको ढाँचाले सही दिशामा लैजान्छ र कुनले लैजाँदैन भनेर यसले विस्तारै सिक्दै जान्छ,” एन्थ्रोपिकका प्रमुख विज्ञान अधिकृत जारेड क्याप्लानले भने ।
के रिइन्फोर्समेन्ट लर्निङ र रिजनिङ गर्ने प्रणाली एउटै हुन् ?
होइनन् । रिइन्फोर्समेन्ट लर्निङ कम्पनीले रिजनिङ गर्ने प्रणाली बनाउन प्रयोग गर्ने विधि हो । यो तालिमको यस्तो चरण हो जसले अन्तिममा च्याटबटलाई रिजनिङ गर्न सक्षम बनाउँछ ।
के यी रिजनिङ गर्ने प्रणालीले अझै गल्ती गर्छन् ?
अवश्य गर्छन् । च्याटबटले गर्ने हरेक कुरा सम्भाव्यतामा आधारित हुन्छ । यसले आफूले सिकेको डेटा (चाहे त्यो इन्टरनेटबाट आएको होस् वा रिइन्फोर्समेन्ट लर्निङबाट) सँग मिल्दोजुल्दो बाटो रोज्छ । कहिलेकाहीँ यसले गलत वा अर्थहीन विकल्प रोज्न सक्छ । त्यस्तोमा यस मोडेलले गलत वा भ्रामक उत्तर दिन सक्छ ।
के यो मानव बौद्धिकतासँग मेल खाने मसिनको बाटो हो ?
एआई विज्ञ यस प्रश्नमा विभाजित छन् । यी विधि अझै तुलनात्मक रूपमा नयाँ छन् भने अनुसन्धानकर्ताहरू अझै पनि यिनका सीमा बुझ्ने प्रयास गरिरहेका छन् । एआई क्षेत्रमा नयाँ विधिहरू प्रायः सुरुमा धेरै छिटो प्रगति गर्छन् । त्यसपछि सुस्त हुँदै जान्छन् ।
न्यूयोर्क टाइम्सले निःशुल्क उपलब्ध गराएको ‘हाउ एआई रिजन्स’ शीर्षकको लेखबाट अनुवादित लेख ।