काठमाडौं । पछिल्ला केही वर्षमा एकदमै धेरै चर्चामा आएको विषय हो, आर्टिफिसियल इन्टेलिजेन्स (एआई) । एआईको मेरुदण्डको रूपमा डिप लर्निङलाई लिइन्छ । यही डिप लर्निङ प्रयोग गरेर अहिले एआई प्रविधिमा धेरै नयाँ टुल विकास भएका छन् ।
हामीले अहिले दैनिक प्रयोग गर्ने विभिन्न एप्लिकेसनहरू, ल्याङ्ग्वेज ट्रान्सलेसन टुल, फेस रिकग्निसन टुल, अटो रिप्लाई लगायतका विभिन्न टुल यही डिप लर्निङमा आधारित एआई प्रणालीमा बनेको हुन्छ ।
डिप लर्निङ कुनै नयाँ कुरा नभए पनि समयसँगै यो प्रणालीमा धेरै नयाँ परिवर्तन आएका छन् । हाम्रो लागि सबैभन्दा सहज उदाहरण भनेको अहिलेको च्याटजीपीटी हो । अन्य उदाहरणहरूमा ड्याल-ई, मिडजर्नी, स्टेबल डिफ्युजन लगायत छन् ।
डिप लर्निङ मसिन लर्निङको एउटा पाटो हो । सुन्दा उस्तै लागे पनि यी दुवै नितान्त फरक छन् ।
डिप लर्निङ र मसिन लर्निङ
मसिन लर्निङ अन्तर्गतकै एक पाटो हो, डिप लर्निङ । कम्प्युटरलाई दिइएको डेटाका आधारमा डिप लर्निङ आफैंले सिकेर भविष्यमा विभिन्न काम गर्न सक्छ ।
मसिन लर्निङ भनेको स्पष्ट रूपमा प्रोग्राम नगरिकनै कम्प्युटरले काम गर्नसक्ने क्षमता हो । जसरी मान्छेले ठूला डेटामा काम गर्नसक्छ, अथवा कुनै फोटो वा भिडिओबाट कुनै डेटा कम्पाइल गर्नसक्छ, त्यसरी एउटा कम्प्युटरले गर्न सक्दैन । यी समस्यालाई डिप लर्निङले सम्बोधन गर्दछ ।
डिप लर्निङ मानव मष्तिष्कको आधारमा तयार गरिएको एउटा मोडेल हो, जसले मसिन लर्निङमा भएका चुनौतीहरूको सामना गर्न मद्दत गर्दछ । यसर्थ यो मसिन लर्निङको एउटा सबसेट हो, जसले आर्टिफिसियल इन्टेलिजेन्स प्रणालीमा परिष्कृत अल्गोरिदम प्रयोग गरेर कम्प्युटरलाई टास्क गर्न मद्दत गर्छ ।
उदाहरणको लागि बैंकमा हुने फ्रड पत्ता लगाउने एउटा प्रोग्राम तयार गर्नुपर्यो । यसको लागि मसिन लर्निङको अल्गोरिदमलाई प्रशिक्षण दिन बैंकमा हुने कारोबारको सूची र त्यसबाट पैदा हुने कानूनी र गैरकानूनी गतिविधिका विवरण दिएर तयार गर्नुपर्छ ।
यसपछि उक्त मसिन लर्निङको मोडेलले उक्त कारोबारमा हुने वैधानिक र अवैधानिक कारोबारको विवरणलाई अध्ययन गर्दछ । यसरी अध्ययन गरिसकेपछि तपाईंले सो मोडेललाई कुनै नयाँ बैंकको कारोबारको डेटा दिनुभयो भने उक्त मोडेलले आफैं कुन कारोबार वैधानिक हो र कुन अवैधानिक कारोबार हो भनेर छुट्टाउन सक्छ ।
मसिन लर्निङलाई जति उच्च गुणस्तरको डेटा दिइन्छ, अल्गोरिदमले त्यति नै उच्च गुणस्तरको काम गर्दछ ।
डिप लर्निङ र न्युरल नेटवर्क
सामान्य रूपमा मसिन लर्निङ अल्गोरिदमले विभिन्न प्रोग्रामको समस्या समाधान गर्ने भएपनि यसले सफ्ट डेटा अर्थात् फोटो, भिडिओ, आवाज र अक्षरहरूसँग सम्बन्धी समस्याहरूलाई भने सहज रुपमा समाधान गर्न सक्दैन ।
उदाहरणका लागि स्तन क्यान्सर पत्ता लगाउने एउटा मोडेल तयार गर्नुपर्यो । यसमा क्लासिक मसिन लर्निङ प्रयोग गर्दा विभिन्न डोमेन विज्ञहरू, कम्प्युटर प्रोग्रामर र गणितिज्ञहरूको आवश्यकता पर्दछ । कम्प्युटरलाई एक्सरे र एमआरआईको प्रकृति बुझाउन निकै मेहनत लाग्छ ।
यो मोडेलमा काम गर्दा एउटा एआई मोडेल तयार गर्न एक वर्ष वा त्योभन्दा बढी पनि लाग्नसक्छ । यो समस्यालाई डिप लर्निङ अल्गोरिदमले डिप न्युरल नेटवर्क प्रयोग गरेर समाधान गर्ने क्षमता राख्दछ ।
डिप लर्निङमा जटिल, मल्टि-लेयर (multi-layered) डिप न्युरल नेटवर्क निर्माण गरिएको हुन्छ, जसले डेटालाई नोड (nodes) हरूको बीचमा पार गराउँछ । यसलाई सामान्य रुपमा बुझ्दा तह-तहमा मिलेर बसेको डेटा हो । तालिम दिए अनुरुप यो आफैं एक तहमाथि अर्को गर्दै मिलेर बस्छ ।
सोही अनुरुप यसले आफ्नो कामहरू गर्ने गर्दछ । यसले अव्यवस्थित रुपमा रहेका डेटाबाट साझा प्याटर्न पत्ता लगाउन सक्छ । उदाहरणको लागि एउटा डिप न्युरल नेटवर्कलाई विभिन्न वस्तुहरूको तस्वीरको विषयमा पढाउनुपर्ने छ भने यसमा मसिन आफैंले विभिन्न आकार तथा अन्य साझा जानकारीहरू बटुलेर कुन वस्तु के हो भनेर आफैं पत्ता लगाउन सक्छ ।
हुन त न्युरल नेटवर्कको प्रयोग सन् १९५० देखि नै हुँदै आएको छ । तर पछिल्लो समयमा आर्टिफिसियल इन्टेलिजेन्सको चर्चासँगै यसको चर्चा पनि बढ्न थालेको हो ।
आजको दिनमा भिन्न-भिन्न प्रकारको डिप-लर्निङ प्याटर्नहरू देख्न सकिन्छ, जसमा कनभोलुसनल न्युरल नेटवर्क (तस्वीरको डेटा निकाल्ने), रिकरेन्ट न्युरल नेटवर्क (आवाज, अक्षर र संगीतको डेटा निकाल्ने), ग्राफ न्युरल नेटवर्क (ग्राफिक डेटा) लगायतका रहेका छन् ।