close

गुगल सर्च लाइभ नेपालसहित २०० बढी देशमा उपलब्ध, नयाँ एआई अडियो तथा भ्वाइस मोडेल पनि सार्वजनिक

टेकपाना टेकपाना

चैत १३, २०८२ ९:९

गुगल सर्च लाइभ नेपालसहित २०० बढी देशमा उपलब्ध, नयाँ एआई अडियो तथा भ्वाइस मोडेल पनि सार्वजनिक

काठमाडौँ । गुगलले आफ्नो आर्टिफिसियल इन्टेलिजेन्स (एआई) को नयाँ अडियो तथा भ्वाइस मोडेल Gemini 3.1 Flash Live सार्वजनिक गरेको छ । गुगलका अनुसार यो उसको अहिलेसम्मकै सबैभन्दा उच्च गुणस्तरको अडियो मोडेल हो, जसले मानिसहरूबिच हुने कुराकानी जस्तै प्राकृतिक लय र गतिमा संवाद गर्न सक्छ ।

गुगलले आफ्नो ब्लगमा उल्लेख गरे अनुसार Gemini 3.1 Flash Live ले आवाजको उतारचढाव (pitch) र गति (pace) लाई अझ सूक्ष्म रूपमा बुझ्न सक्छ । यो मोडेल पुरानो संस्करणको तुलनामा निकै तीव्र छ र यसले लामो समयसम्म कुराकानीको सिलसिलालाई टुट्न नदिई पछ्याउन सक्छ ।

प्राविधिक रूपमा यो मोडेलले विभिन्न जटिल परीक्षणहरूमा उत्कृष्ट नतिजा ल्याएको छ । गुगलका अनुसार ComplexFuncBench Audio परीक्षणमा यसले ९०.८ प्रतिशत अङ्क प्राप्त गरेको छ । जसले यसलाई जटिल कार्यहरू र फङ्सन कलिङका लागि अत्यन्त भरपर्दो प्रमाणित गर्दछ । यस्तै Scale AI को Audio MultiChallenge मा पनि यसले ३६.१ प्रतिशतको स्कोरका साथ अग्र स्थान कायम गरेको छ । यो मोडेल ९० भन्दा बढी भाषाहरूमा उपलब्ध रहेको गुगलले जनाएको छ ।

एआईद्वारा सिर्जित सामग्रीबाट हुने भ्रम र गलत सूचना रोक्न गुगलले विशेष सतर्कता अपनाएको छ । गुगलका अनुसार ३.१ फ्ल्याश लाइभबाट उत्पादन हुने सबै अडियोहरूमा SynthID नामक वाटरमार्क प्रयोग गरिएको छ । यो वाटरमार्क मानिसको कानले सुन्न नसकिने गरी अडियोमा नै समावेश गरिएको हुन्छ, जसले गर्दा कुनै पनि अडियो एआईले बनाएको हो कि होइन भनेर सजिलै पहिचान गर्न सकिन्छ ।

यही मोडेलको सहयोगमा गुगलले आफ्नो सर्च लाइभ (Search Live) फिचरलाई विश्वका २०० भन्दा बढी देश र क्षेत्रहरूमा विस्तार गरेको छ । जुलाई २०२५ मा अमेरिका र भारतबाट सुरु भएको यो सेवा अब एआई मोड उपलब्ध भएका सबै स्थान र भाषाहरूमा उपलब्ध भएको हो ।

सर्च लाइभ मार्फत प्रयोगकर्ताले आफ्नो फोनको क्यामेरा कुनै वस्तुतर्फ सोझ्याएर त्यसको बारेमा तत्काल गुगलसँग कुराकानी गर्न सक्छन् । जस्तै कुनै नयाँ दराज कसरी जडान गर्ने भन्ने थाहा पाउन क्यामेराले दराजलाई हेर्दै गुगललाई प्रश्न सोध्न सकिन्छ । यसमा प्रयोगकर्ताले आवाजमार्फत प्रश्न सोध्ने, जवाफ सुन्ने र थप जानकारीका लागि वेब लिङ्कहरूमा जान सक्ने सुविधा छ । एन्ड्रोइड र आईओएस दुवैमा गुगल एप भित्र रहेको Live आइकन थिचेर वा गुगल लेन्स मार्फत यो फिचर प्रयोग गर्न सकिन्छ ।

यसैगरी गुगलले आफ्नो लाइभ ट्रान्सलेट सुविधालाई पनि परिष्कृत गरेको छ । अब आईओएस प्रयोगकर्ताहरूले पनि आफ्ना हेडफोनमा रियल-टाइममा अनुवाद सुन्न सक्नेछन् । यो फिचर अब जर्मनी, स्पेन, फ्रान्स, नाइजेरिया, इटाली, बेलायत, जापान, थाइल्याण्ड र बङ्गलादेश जस्ता थप देशहरूमा विस्तार गरिएको छ ।

यो प्रविधिले ७० भन्दा बढी भाषाहरू सपोर्ट गर्दछ । यसले वक्ताको बोल्ने शैली, जोड र आवाजको लयलाई जस्ताको तस्तै राखेर अनुवाद गर्छ । यसको प्रयोग गरेर आफ्नै भाषामा लेक्चर सुन्न, विदेशी चलचित्र हेर्न वा अर्कै भाषा बोल्ने व्यक्तिसँग प्रत्यक्ष कुराकानी गर्न सहज हुनेछ ।

गुगलका अनुसार यो नयाँ प्रविधि हाल विभिन्न तहमा उपलब्ध छ ।डेभलपरहरूका लागि गुगल एआई स्टुडियोमा Gemini Live API मार्फत यो मोडेल प्रिभ्युमा उपलब्ध छ भने उद्यमहरूका लागि ग्राहक सेवा सुधार गर्न Gemini Enterprise मा यो मोडेल समावेश गरिएको छ ।

यसैगरी सर्वसाधारणका लागि Search Live र Gemini Live मार्फत यसको अनुभव लिन सकिनेछ । भेरिजोन, लाइभकिट र द होम डिपो जस्ता ठुला कम्पनीहरूले यो नयाँ मोडेलको प्रयोगबाट ग्राहकसँगको संवाद अझ सहज र प्राकृतिक भएको प्रतिक्रिया दिएको गुगलको ब्लगमा उल्लेख छ । यो मोडेलले पृष्ठभूमिमा हुने होहल्लालाई फिल्टर गरेर प्रयोगकर्ताको आवाजमा मात्र ध्यान केन्द्रित गर्न सक्ने क्षमता समेत राख्दछ ।

कसरी प्रयोग गर्ने गुगल सर्च लाइभ ?

गुगल एपबाट यो फिचर प्रयोग गर्न सबैभन्दा पहिला आफ्नो एन्ड्रोइड वा आईओएस डिभाइसमा गुगल एप खोल्नुहोस् । एपको सर्च बारको मुनि वा AI Mode बटनको छेउमा रहेको Live आइकनमा ट्याप गर्नुहोस् ।

यदि तपाईँले पहिलेदेखि नै गुगल लेन्स प्रयोग गरिरहनुभएको छ भने स्क्रिनको तल Translate पछि देखिने Live ट्याबमा ट्याप गरेर यो फिचर सक्रिय गर्न सक्नुहुन्छ ।

फिचर सुरु भएपछि तपाईंले कुनै पनि विषयमा आवाजमार्फत प्रश्न सोध्न सक्नुहुन्छ र गुगलबाट तत्कालकै समयमा अडियो जवाफ प्राप्त गर्न सक्नुहुन्छ । यसमा मानिससँग कुरा गरे जस्तै गरी एउटा प्रश्नपछि अर्को पुरक प्रश्न (follow-up question) पनि सोध्न सकिन्छ ।

यदि तपाईंलाई आफ्नो अगाडि रहेको कुनै भौतिक वस्तुको बारेमा सहयोग चाहिएको छ भने (जस्तै: कुनै दराज कसरी जडान गर्ने), तपाईंले फोनको क्यामेरा त्यस वस्तुतर्फ सोझ्याउन सक्नुहुन्छ । यसले गुगललाई दृश्य सन्दर्भ (visual context) प्रदान गर्दछ । जसको आधारमा उसले तपाईंको क्यामेराले देखेको कुरा बुझेर उपयुक्त सुझावहरू दिन्छ ।

कुराकानीका क्रममा प्राप्त जानकारीको गहिराइमा पुग्नका लागि उपलब्ध वेब लिङ्कहरूमा क्लिक गरेर थप अध्ययन गर्न पनि सकिन्छ ।

पछिल्लो अध्यावधिक: चैत १३, २०८२ ९:९