काठमाडौं । गुगलले दिइएको निर्देशनका आधारमा भिडिओ (टेक्स्ट टु भिडिओ) तयार पारिदिने लार्ज ल्याङ्ग्वेज मोडेल (एलएलएम) सार्वजनिक गरेको छ । एक ब्लग पोस्टमार्फत भिडिओ तयार पार्न सक्ने नयाँ एआई मोडेल गुगलले सार्वजनिक गरेको हो ।
‘भिडिओ पोइट’ नामक यस मोडेलले अक्षर, फोटो, भिडिओ र अडियोलाई प्रोशाेधन गर्नसक्ने गुगलका वैज्ञानिकहरूले जनाएका छन् । उनीहरूका अनुसार यस टुललाई अन्य एलएलएममा जस्तै 'प्रिट्रेनिङ' र 'टास्क स्पेसिफिक ट्रेनिङ' दिइएको छ ।
तर यसले तालिम नदिइएको विषयमा समेत सामग्रीहरू तयार पार्नसक्ने बताइएको छ । यो अटोरिग्रेसिभ मोडेल भएकाले पहिले के बनाइसकिएको छ, त्यो हेर्न सक्नेछ ।
भिडिओ पोइटलाई शक्तिशाली बनाउन फरक-फरक भिडिओ तयार पार्ने क्षमता एउटै एलएलएममा एकीकृत गरिएको कम्पनीकाे भनाइ छ । यसले टेक्स्ट टु भिडिओ, इमेज टु भिडिओ, भिडिओ स्टाइलाइजेसन, भिडिओ इनपेन्टिङ एन्ड आउटपेन्टिङ, भिडिओ टु अडियो जस्ता कार्य सक्ने बताइएको छ ।