सन् २०२४ एआई र एलएलएम (लार्ज ल्याङ्ग्वेज मोडेल) को वर्षको रूपमा सम्झनामा रहनेछ । च्याटजीपीटी ठुलो खेलाडीको रूपमा रहेको छ । मेटाको लामा र क्लाउडी जस्ता मोडेलहरू विकसित भइरहेका छन्, तर गुगलको जेमिनाई अरूभन्दा पृथक् छ ।
विशेष गरी जेमिनाईको इमेजिन इमेज-जनरेटिङ सिस्टमलाई लिएर कम्पनीले केही धक्का समेत महसुस गर्नु पर्यो । तर, गुगलले आफ्नो वर्कस्पेसमा रहेका एपहरूमा गरेको एकीकरणले यसलाई एक अपरिहार्य उत्पादनशील उपकरण बनाएको छ । यसबाहेक, यसले गुगल असिस्टेन्ट र स्मार्ट होम डिभाइसहरूमा थप नयाँ क्षमता पनि थप गरेको छ ।
जेमिनाईले यसअघिका बार्ड र डुयट एआईहरूको क्षमताबाट रिब्रान्डिङ भयो । एन्ड्रोइडमा जेमिनाईको डेडिकेटेड एप रोलआउट भयो, गुगल एपसँग एकीकृत रूपमा आईओएसमा आयो अनि गुगल वर्कस्पेसमा पनि समावेश भयो । कम्पनीले नोटबुकएलएम पनि ल्यायो, जुन एक नयाँ र उपयोगी टुल हो, जसले एक इन्टेलिजेन्ट व्यक्तिगत डिजिटल नोटबुकको रूपमा काम गर्न सक्छ ।
गुगलले आफ्ना विद्यमान उत्पादनहरूमा एआईलाई एकीकरण गर्ने कार्यमा ध्यान केन्द्रित गर्यो । उदाहरणका लागि, एन्ड्रोइड १५ मा एआईले ओएसका मुख्य कार्यहरूलाई अप्टिमाइज गर्यो, जसले ब्याट्रीको आयु तथा पर्फर्मेन्समा सुधार ल्यायो । यस अलावा, कम्पनीले पिक्सेल फोनहरूमा एआई-पावर्ड क्यामेरा सुविधाहरूलाई थप परिष्कृत गरिरहेको छ । जसले कम्प्युटेसनल फोटोग्राफीलाई सन् २०२५ को वर्ष हेर्न लायक ‘हट ट्रेन्ड’ बनाउन सक्छ ।
गुगलले मानव-मसिनबिचको अन्तरक्रियाका सीमा परिभाषित गर्नका लागि २०२३ को आ/ओ इभेन्टमा जेमिनाईका सम्भावनालाई प्रस्तुत गरेको थियो । जब सार्वजनिक भयो, त्यसले निराश पारेन । जेमिनाईले टेक्स्ट, कोड, र इमेजलाई सहजै एकीकृत गर्न सक्छ । यी फिचरले तुरुन्तै यसलाई अध्ययन र अनुसन्धानका लागि दक्षता बढाउने उपकरण बनाएको छ, सिर्जनात्मक सामग्री उत्पादनमा सघाएको छ, र कम प्रयास गरेरै दोहोरिने कामहरू सम्पन्न गर्न मद्दत पुर्याइरहेको छ । यसको विस्तारित कन्टेक्स्ट विन्डो कुनै पनि प्रतिस्पर्धीभन्दा बढी जानकारीलाई संश्लेषण गर्न सक्षम छ, जसले यसलाई एक प्रमुख एआईको रूपमा स्थापित गरेको छ ।
जेमिनाई सन् २०२४ मा च्याटजीपीटीको एक वैकल्पिक प्लेटफर्मको रूपमा उदायो । यसको विकसित तर्क क्षमताले अधिक सूक्ष्म र मानव-जस्तो संवाद गर्ने अनुमति दिन्छ । एक जेमिनाई एड्भान्स प्रयोगकर्ताको रूपमा तपाईँ उपयोगी र सटीक उत्तर प्राप्त गर्न सक्नु हुन्छ, जसले सन्दर्भ र उद्देश्यको बुझाइमा सुधार ल्याउँछ ।
तस्विर सिर्जनाः इमेजेनमा लागेको धक्कापछिको फिर्ती
जेमिनाईको क्रान्तिकारी विकासका बाबजूद यसको इमेज जनरेसनको हिस्सा, इमेजेनले सुरुवाति चरणमै धक्का सामना गर्नु पर्यो । परिणाम स्वरूप फेब्रुअरी महिनामा गुगलले मानव तस्विर निर्माण गर्नसक्ने यसको क्षमता तत्कालका लागि स्थगित गर्यो । केही महिना पछि यो एक सामान्य समाधानको रूपमा पुनः अनलाइन आएको छ । प्रारम्भिक चरणमा यसमा विभिन्न त्रुटिहरू देखिएका थिए । जसले सिर्जना गरेका तस्विरहरू भ्रमपूर्ण हुनेदेखि अजीब खाले सिर्जना गरिरहेको थियो । यसै क्रममा सांस्कृतिक पूर्वाग्रह राखेको आरोप समेत कम्पनीमाथि लागेको थियो।
गुगलले यी समस्या समाधान गर्ने प्रयास नगरेको होइन, तर त्यसका कारण सिर्जित नकारात्मक धारणाले दीर्घकालीन प्रभाव पार्यो । पछिका अपडेटहरूबाट पनि इमेजेनले चाहेको प्रभाव सिर्जना गर्न सकेन । जसलाई सुरुमा एक रूपान्तरणकारी इमेज-जनरेसन उपकरणको रूपमा प्रस्तुत गरिएको थियो, त्यो जेमिनाईको सबैभन्दा कमजोर घटकको रूपमा रहन गयो ।
नोटबुकएलएम
गुगलले सन् २०२४ मा चुपचापसँग अर्को महत्वपूर्ण एआई इनोभेसन नोटबुक एलएम प्रस्तुत गर्यो । यो प्रयोगात्मक प्रोजेक्टले अलि फरक अवधारणा लियो, जुन व्यक्तिगत आवश्यकताहरूको आधारमा अनुकूलित एआई अनुभव प्रदान गर्ने कार्यमा केन्द्रित रह्यो । नोटबुकएलएमले तपाईँले प्रदान गरेको डेटामा आधारित भएर एआईलाई प्रशिक्षित गर्दछ र तपाईँले दिएका लिङ्क, फोटो, भिडिओ, नोट र डकुमेन्टहरूलाई साधारण नोटबुक-जस्तो इन्टरफेसमा वर्गीकृत गरिदिन्छ ।
नोटबुकएलएम मानव अनुसन्धान सहायकभन्दा छिटो काम गर्न सक्छ । नोटबुकएलएमले अनुसन्धान, जानकारीको संश्लेषण र उत्पादनशील कार्यहरूमा धेरै समय र प्रयास बचाइदिन्छ । यो ठुलो तस्विरदेखि साना विवरण व्यवस्थापन गर्नमा समान रूपले दक्ष छ ।
नोटबुकएलएम बैठकका नोटहरूको सारांश रु आउटलाइन (रूपरेखा) तयार पारिदिन्छ र तपाईँका डकुमेन्टहरूबाट प्रश्नोत्तर सिर्जना गरेर अध्ययनमा सघाउन पनि सक्छ । यसको अडियो ओभरभ्युज सुविधाले यसलाई तपाईँका स्रोतहरूबाट गतिशील र प्राकृतिक जस्तै सुनिने ध्वनिमा भर्चुअल पडकास्ट सिर्जना गरिदिन सक्छ । सामान्य उद्देश्यको एआईबाट व्यक्तिगत अनुभवमा ध्यान केन्द्रित गरेर जेमिनाईले एआईको अर्थ र यसको प्रभावलाई २०२५ मा थप विस्तार गर्ने अपेक्षा राख्न सकिन्छ।
एन्ड्रोइड १५
एन्ड्रोइड १५ को रिलिजसँगै गुगलले आफ्नो मोबाइल अपरेटिङ सिस्टममा एआईको प्रयोगलाई प्रवर्धन गर्न थालेको छ । एन्ड्रोइड १५ ले डिभाइसमा आधारित एआई उपयोग गरी महत्त्वपूर्ण कार्यहरू अप्टिमाइज गर्छ, जसले ब्याट्रीको आयु र प्रदर्शनमा सुधार ल्याउँछ । यसमा प्रत्येक एपको प्रयोगको ढाँचामा रहेर इन्टेलिजेन्ट तवरमा रिसोर्स विभाजन गर्छ, डाइनामिक किसिमले सेटिङ समायोजन गर्छ, र ब्याकग्राउन्ड प्रोसेसलाई प्रभावकारी रूपमा व्यवस्थापन गरिदिन्छ।
एआईले एन्ड्रोइड १५ मा प्रयोगकर्ताको अनुभवलाई रूपान्तरण गर्दैछ । प्रिडिक्टिभ एप लन्चिङ जस्ता फिचरले प्रयोगकर्ताका आवश्यकताको अनुमान लगाउँछन्, स्मार्ट टेक्स्ट सेलेक्सनले अन्तरक्रियाहरूलाई सरल बनाउँछ, र सिस्टम सेटिङ्समा पर्सनलाइज्ड रिकमन्डेसनले उपयुक्त मार्गदर्शन दिन्छ । यी नयाँ फिचरले एआईलाई लिएर गुगलले राखेको समग्र दृष्टिकोणले एक वर्षमा हामी कहाँसम्म पुगेका छौँ भन्ने कुरा देखाउँछ।
फोटोग्राफी
हामीले मोबाइल फोटोग्राफीमा रोचक किसिमको प्रगति देख्यौँ, जसमा प्रमुख भूमिका एआई प्रोसेसिङले निभायो । गुगलको पिक्सेल फोनलाई गुणस्तरीय क्यामेरा भएको फोनको रूपमा चिनिन्छ । यसले एआई-पावर्ड फिचरमार्फत आफ्नो क्षमतामा वृद्धि गर्यो । सन् २०२१ मा प्रस्तुत गरिएको म्याजिक इरेजर अब फोटोहरूबाट नचाहेका वस्तुहरूलाई हटाउनमा झन् सटीक भएको छ । एआईले जुम क्षमतामा सुधार गर्यो, जसले विवरणहरू भर्न र आवाज घटाउन मद्दत गरेको छ । अटोमेटिक एडिटिङ सजेसनले एक मात्र ट्यापमा फोटोमा सुधार ल्याउने नयाँ विकल्प तयार पारेको छ ।
त्यसो त एआईबाट सञ्चालित क्यामेरा प्रविधिको वृद्धि केवल गुगलमा मात्रै सीमित छैन । सामसङले आफ्नो विकसित सिन रिकग्निसन र इमेज अप्टिमाइजेसन टुलमार्फत प्रगति गरिरहेको छ । यी निर्माता र एप्पल जस्ता अन्य बीचको प्रतिस्पर्धाले नवप्रवर्तनलाई तीव्र पार्न प्रेरित गरेको छ । फल स्वरूप, स्मार्टफोन प्रयोगकर्ताहरू कम्प्युटरमा आधारित फोटो एडिटर प्रयोग नगरिकनै यसअघि भन्दा राम्रा फोटो खिच्न, एडिट गर्न र शेयर गर्न सक्ने भएका छन् ।
२०२५ मा आउनसक्ने अवसर र जोखिम
सन् २०२४ एआईमा गुगलको प्रयासका लागि महत्त्वपूर्ण वर्ष रह्यो, जसमा नयाँ नवीनतम उत्पादन र एआईको गहिरो एकीकरण थियो । जेमिनाईले एलएलएममा कम्पनीको महत्त्वपूर्ण स्थान कायम गर्यो, जसमा ठुलो कन्टेक्स्ट विन्डो (अब जेमिनाई प्रोमा २० लाख टोकन) र प्रभावशाली मल्टिमोडल क्षमताहरू रहेका छन् । यसले गुगललाई तीव्र गतिमा विकसित हुँदै गरेको एआई परिदृश्यमा एक नेतृत्वदायी कम्पनी बनाउनमा मद्दत गर्यो, र केही मापदण्डमा त च्याटजीपीटीलाई पनि यसले पछि पारेको छ ।
यद्यपि, सन् २०२४ ले एआईका जटिलता र सम्भावित जोखिमहरूलाई पनि उजागर गरेको छ । जेमिनाईको इमेजेनले त्रुटिहरू र पूर्वाग्रहको समस्या भोग्नु पर्यो । यसैबिच, गुगलको नोटबुकएलएम, अन-डिभाइस एआई, र एआई-पावर्ड फोटोग्राफीमा प्रगति भएको छ, जसले एआईले हाम्रो जीवनलाई सजिलो र प्रभावकारी बनाउने महत्त्वपूर्ण क्षमता प्रस्तुत गरेको छ ।
हामीलाई भने एआईलाई नराम्रो उद्देश्यका लागि प्रयोग गर्ने जस्ता खराब क्रियाकलाप गर्नेहरूबाट सतर्क रहनु पर्ने चुनौती छ । डिपफेक, एआई रोबोकल्स र अन्य जोखिमलाई रोक्न मानव सतर्कता र गुगल जस्ता इन्डस्ट्री लिडरहरूको हस्तक्षेप जरुरी हुन्छ ।