close

मेटाले ल्यायो दृश्य र अक्षर दुवै सपोर्ट गर्ने ओपन एआई मोडल

टेकपाना टेकपाना

असोज ११, २०८१ १२:१४

मेटाले ल्यायो दृश्य र अक्षर दुवै सपोर्ट गर्ने ओपन एआई मोडल

 

काठमाडौं । मेटाका प्रमुख कार्यकारी अधिकृत (सीईओ) मार्क जुकरबर्ग ओपन सोर्सको पक्षमा छन् । यसमा उनले केही काम पनि गरिरहेका छन् । यही पक्षलाई निरन्तरता दिँदै मेटाले बुधवार सम्पन्न ‘मेटा कनेक्ट २०२४’मा लामा ३.२ (Llama 3.2 ) नामक ओपन सोर्स एआई मोडेल सार्वजनिक गरेको छ । 

भिजुअल एबिलिटी (दृश्य क्षमता) सहितको यो पहिलो ओपन सोर्स एआई मोडेल पनि हो । अर्थात् यस मोडेलले फोटो र अक्षर दुवैमा काम गर्न सक्छ । यसअघि मेटाले उपलब्ध गराएको ओपन एआई मोडेलमा यो फिचर थिएन ।

नयाँ मोडेल लामा ३.२ मार्फत अब डेभलपरहरूले अग्मेन्टेड रियालिटी, भिजुअल सर्च इन्जिन, डकुमेन्ट एनालिसिस जस्ता क्षेत्रमा थप आधुनिक एप्लिकेसनहरू बनाउन सक्नेछन् । मेटाका अनुसार डेभलपरलाई यो नयाँ मोडेल प्रयोग गर्न सजिलो पनि हुनेछ । 

यसले गर्दा नयाँ मल्टिमोडालिटी प्रयोग गर्न डेभलपरहरूले धेरै मेहेनत गर्नुपर्ने छैन । उनीहरूले लामालाई फोटो उपलब्ध गराएर त्यसैका आधारमा कुराकानी गर्न सक्ने बताइएको छ ।

मल्टिमोडालिटी भनेको कुनै पनि एआई मोडेललाई विभिन्न प्रकारका इनपुटहरू (टेक्स्ट, इमेज, अडिओ र भिडिओ) प्रशोधन गर्न सक्षम बनाउने क्षमता हो । यस्ता मोडेलमा एकभन्दा बढी प्रकारका जानकारीलाई बुझ्न र तिनको आधारमा प्रतिक्रिया दिन सक्नेगरी तालिम दिइन्छ । 

ओपनएआई, गुगल लगायतका एआईमा काम गर्ने कम्पनीहरूले यसअघि नै मल्टिमोडालिटी मोडेलहरू सार्वजनिक गरिसकेका थिए । तर फोटो पनि सपोर्ट गर्ने भएकाले मेटाको यो एआई थप प्रभावशाली बन्ने अपेक्षा गरिएको छ । 

मेटाको यस लामा ३.२ मा दुई ओटा भिजन मोडेल समावेश छन् । जसमा ११ अर्ब र ९० अर्ब प्यारामिटरहरू छन् । यसका साथै दुई ‌ओटा टेक्स्ट वन्ली (अक्षर मात्रको) मोडेल छन्, जसमा १ अर्ब र ३ अर्ब प्यारामिटरहरू छन् । साना मोडेलहरू क्वालकम, मिडियाटेक र अन्य आर्म हार्डवेयरमा काम गर्नेगरी डिजाइन गरिएका छन् । यसो हुँदा तिनलाई मोबाइलमा पनि प्रयोग गर्न सकिने बताइएको छ ।

पछिल्लो अध्यावधिक: असोज ११, २०८१ १२:१४