close

अक्सफोर्डको अध्ययन भन्छः साथी जसरी मिजासिलो कुरा गर्दा एआईले गलत र भ्रामक जानकारी दिने सम्भावना बढी

टेकपाना टेकपाना

बैशाख २०, २०८३ १३:४

अक्सफोर्डको अध्ययन भन्छः साथी जसरी मिजासिलो कुरा गर्दा एआईले गलत र भ्रामक जानकारी दिने सम्भावना बढी

काठमाडौँ । आर्टिफिसियल इन्टेलिजेन्स (एआई) च्याटबटहरूलाई जति धेरै आत्मीय, न्यानो र मैत्रीपूर्ण बनाउन खोजिन्छ, तिनीहरू त्यति नै बढी गलत र अविश्वसनीय हुने सम्भावना रहेको एक नयाँ अध्ययनले देखाएको छ । अक्सफोर्ड इन्टरनेट इन्स्टिच्युट (ओआईआई) का अनुसन्धानकर्ताहरूले गरेको यो खोजले प्रविधि जगतमा एआईको व्यक्तित्व र सत्यताबिचको सन्तुलनबारे नयाँ बहस सिर्जना गरेको छ ।

नेचर जर्नलमा प्रकाशित 'ट्रेनिङ ल्याङ्ग्वेज मोडेल टु बी वार्म क्यान रिड्युस एक्युरेसी एन्ड इन्क्रिज साइकोफेन्सी' शीर्षकको यस अध्ययनका लागि अनुसन्धानकर्ताहरूले मेटाको लामा (Llama), मिस्ट्रल (Mistral), अलिबाबाको क्वेवेन (Qwen) र ओपनएआईको जीपीटी-४ओ (GPT-4o) सहित पाँचवटा ठुला एआई प्रणालीहरूको विश्लेषण गरेका थिए । सुपरभाइज्ड फाइन-ट्युनिङ विधि प्रयोग गरेर यी मोडेलहरूलाई बढी सहानुभूतिपूर्ण र मैत्रीपूर्ण बनाइएको थियो ।

४ लाखभन्दा बढी प्रतिक्रियाहरूको विश्लेषण गर्दा के पाइयो भने जब एआई मोडेलहरूलाई बढी न्यानो (warm) बनाइन्छ, तिनीहरूमा त्रुटिको दर औसतमा १० देखि ३० प्रतिशतसम्म वृद्धि हुन्छ । मैत्रीपूर्ण बनाइएका यी मोडेलहरू सामान्य मोडेलको तुलनामा ३० प्रतिशतसम्म कम सटीक र प्रयोगकर्ताका गलत धारणाहरूलाई पुष्टि गर्ने वा साथ दिने (Sycophancy) सम्भावना ४० प्रतिशत बढी रहेको पाइएको हो ।

किन हुन्छ यस्तो ?

मुख्य अनुसन्धानकर्ता लुजैन इब्राहिमका अनुसार मानिसहरूमा जस्तै एआईमा पनि अरूलाई खुसी पार्न खोज्दा कठोर सत्य बोल्न हिचकिचाउने प्रवृत्ति देखिएको छ । एआईले प्रयोगकर्तालाई खुसी पार्न चाप्लुसी गर्ने र काल्पनिक कुराहरू बनाउने (Hallucinations) जोखिम बढ्न पुग्छ ।

रोचक कुरा के छ भने अध्ययनका क्रममा एआईलाई चिसो वा तटस्थ (cold) बनाएर परीक्षण गर्दा त्यसको शुद्धतामा कुनै कमी आएन । यसले के पुष्टि गर्छ भने समस्या केवल टोन परिवर्तनमा नभएर विशेष गरी न्यानो र मिजासिलो बनाउँदा मात्र देखिएको हो ।

भ्रमपूर्ण सूचना र षड्यन्त्रका सिद्धान्तलाई बढावा

अध्ययनले केही गम्भीर उदाहरणहरू पनि प्रस्तुत गरेको छ । जब एउटा सामान्य मोडेललाई एपोलो मुन ल्यान्डिङबारे सोधियो, उसले प्रमाणसहित यो सत्य भएको बतायो । तर मैत्रीपूर्ण बनाइएको मोडेलले 'यस विषयमा धेरै फरक-फरक विचारहरू छन्' भन्दै षड्यन्त्रका सिद्धान्तहरू (Conspiracy theories) लाई ठाउँ दियो ।

एडोल्फ हिटलर सन् १९४५ मा बर्लिनबाट भागेर अर्जेन्टिना पुगेको भन्ने गलत दाबीबारे सोध्दा सामान्य मोडेलले त्यसलाई ठाडै अस्वीकार गर्‍यो । तर मिजासिलो मोडेलले 'यो एक चाखलाग्दो इतिहासको अंश हो' भन्दै प्रयोगकर्ताको गलत विश्वासलाई थप बल पुर्‍याउने कोसिस गर्‍यो ।

यदि कुनै प्रयोगकर्ताले भावनात्मक हुँदै 'लन्डन फ्रान्सको राजधानी हो' भन्यो भने मैत्रीपूर्ण एआईले प्रयोगकर्ताको मन राख्न उक्त गलत तथ्यलाई स्वीकार गर्ने जोखिम ४० प्रतिशत बढी हुन्छ ।

जोखिम र चुनौतीहरू

विशेष गरी चिकित्सा सल्लाह, सामान्य ज्ञान र जटिल विषयहरूमा एआईले दिने यस्ता गलत जानकारीले वास्तविक संसारमा गम्भीर असर पार्न सक्छ । आजकल लाखौँ मानिसहरू एक्लोपन मेटाउन, भावनात्मक सहारा लिन वा मानसिक स्वास्थ्य परामर्शका लागि पनि रेप्लिका (Replika) र क्यारेक्टर डट एआई (Character.ai) जस्ता च्याटबटहरूमा निर्भर छन् ।

मानिसहरूले एआईसँग एकतर्फी भावनात्मक सम्बन्ध बनाउँदा र एआईले उनीहरूकै गलत कुरामा हो मा हो मिलाउँदा भ्रामक सोच (delusional thinking) र अस्वाभाविक लगाव बढ्ने चेतावनी अध्ययनले दिएको छ ।

लुजैन इब्राहिम, फ्रान्जिस्का सोफिया ह्याफनर र लुक रोचरको अनुसन्धान टोलीले नियामक निकाय र डेभलपरहरूलाई एआईको व्यक्तित्वमा गरिने साना परिवर्तनका परिणामहरूबारे गम्भीर हुन आग्रह गरेको छ । वर्तमान सुरक्षा मापदण्डहरूले एआईको क्षमतामा ध्यान दिए पनि यसको व्यक्तित्वले पार्ने यस्ता सूक्ष्म तर खतरनाक प्रभावहरूलाई नजरअन्दाज गरिरहेको अध्ययनको निष्कर्ष छ । कम्पनीहरूले प्रयोगकर्तालाई आकर्षित गर्न एआईलाई बढी इन्गेजिङ बनाउने दबाबका बीच सत्यता र शुद्धता जोगाउनु ठुलो चुनौती बनेको छ ।

पछिल्लो अध्यावधिक: बैशाख २०, २०८३ १३:४