scheduleबिहिवार माघ ३ गते, २०७५

भाषाको भण्डारमा प्रविधिको ग्रहण

डा. लक्ष्मीप्रसाद खतिवडा

मानवभाषा र भाषाप्रविधि दुवै विषयवस्तु एकअर्काका परिपूरक अङ्ग बनिसकेका छन् । यी दुईको सम्बन्धलाई कम्प्युटर भाषाविज्ञानका सहायताले अनुप्रयोग निर्माण गरी यथार्थ परिस्थितिमा परीक्षण गर्न सकिन्छ । मानवभाषाको प्राविधिक अनुसन्धान गरी कृत्रिम बुद्धि, प्रमेय, गणित, जैविक, बायोमेडिकल र रासायनिक आदि सूचनाका आधारमा मेसिन प्रशिक्षण सम्भव छ भन्ने कुरा प्रमाणित भइसकेको छ । प्राकृतिक भाषाका कम्प्युटेसनल मोडेलहरू सिर्जना गरी भाषिक पद्धतिको अन्तर्दृष्टि पहिचान गर्न, मानवभाषा अध्ययन गर्न, भाषाका मानसिक प्रक्रियाहरूको व्याख्या गर्न सम्भव छ ।

सञ्जालपृष्ट वा इन्टरनेटपेज हाम्रा दैनिक अन्तरक्रियाको मूल स्रोत बन्न थालेको छ । समग्र इन्टरनेट जालोको जानकारीको ठुलो अंश भाषाको रूपमा रहेको छ । श्रव्यदृष्य र छविचित्रको जानकारी दिन पनि भाषाकै आवश्यकता पर्छ । सञ्जालपृष्ठमा जम्मा भएको भाषाको भण्डारको प्रशोधन गरेर सञ्चार प्रकृयालाई अझ सहज बनाउन शोधकर्ताहरू भाषाप्रविधिको विश्लेषणमा लागिपरेका छन् ।

आजको युग सूचना प्रविधिको युग हो । सूचना भाषामा सङ्ग्रहित हुन्छ । भाषाप्रविधि बेगर सूचनालाई सङ्केतन पद्धतिमा ढाल्न सकिँदैन । अत: सूचना प्रविधिको विकास गर्नु छ भने पहिले भाषाप्रविधिको विकास गर्नुपर्छ । कृत्रिम बुद्धि प्रयोग गरेर एल्गोरिदम या सूत्रका माध्यमबाट भाषाको व्याकरणिक पद्धतिलाई नियमबद्ध बनाउनु पर्छ । तबमात्र भाषाप्रविधिको काम सुरु हुन्छ ।


विकसित भनिएका देशहरूमा कृत्रिम बुद्धिका एल्गोरिदम या सूत्र बनाएर भाषाको व्याकरणिक पद्धतिलाई नियमबद्ध गर्ने काममा धेरै प्रगति भएको छ । सञ्चार विज्ञानको मस्तिष्क सञ्जाल वा न्युरलनेटवर्क र स्नायु विज्ञान वा न्युरो साइन्सले भाषाका तथ्याङ्क सङ्कलन गरेर मानव मस्तिष्कमा बुद्धि कसरी भण्डारण हुन्छ भनेर अध्ययन गर्दछ । कम्प्युटर भाषाविज्ञानका सहायताले वनस्पति विज्ञान, मानव विज्ञान, दर्शन, समाजशास्त्र आदिमा मानव व्यवहार कसरी सञ्चालित हुन्छ भनेर काम गर्न थालिएको छ ।

कम्प्युटर भाषाविज्ञानका सहायताले मेसिन अनुवादले निकै ठुलो फड्को मारिसकेको छ । आजको बहुभाषिक समाजमा मेसिन अनुवाद एउटा महत्वपूर्ण घटकका रुपमा विकास भएको छ । मेसिन अनुवादले स्रोत भाषाका शब्द र वाक्यलाई लक्षित भाषाका शब्द र वाक्यहरूमा प्रतिस्थापन गर्दछ । अनुवाद भनेकै स्रोत भाषाको पाठलाई लक्ष्य भाषाका पाठमा बदल्नु हो । मेसिन अनुवाद भनेको स्रोत भाषाका शब्दहरूलाई लक्ष्य भाषाका नजिकका समकक्षी शब्दहरू लक्षित गरी साङ्ख्यिकीय वा गणितीय प्रविधि प्रयोग गरी समस्या सुल्झाउने एउटा बौद्धिक प्रक्रिया हो । आजको प्रतिस्पर्धात्मक समयमा मेसिन अनुवाद उद्योगको अपार सम्भावना छ । मेसिन अनुवाद विश्व बजारमा पदार्पण गरिसक्यो । अनुवाद उद्योगले विश्वका धेरै भाषामा सफल अनुवाद गरिसकेको छ ।

अनुवादले पुरै विश्वलाई एक सूत्रमा बाँधेको हुन्छ । चाहे राजनीतिक होस् वा सामाजिक अथवा सांस्कृतिक होस् या व्यापारिक, आर्थिक वा वाणिज्य सम्बन्धी वा शुद्ध विज्ञान होस्; जुनसकै विधा होस् अनुवाद बेगर काम चलाउन सक्ने स्थिति छैन । झन हाम्रो जस्तो प्रविधिमा पहुँच नभएको भाषामा त अनुवाद बेगर सिन्को भाँच्न पनि नसकिने अवस्था छ । अनुवादले पारस्परिक विचार आदान प्रदान गरेर मानव संस्कृतिलाई बसुधैव कुटुम्बकमको उद्देश्य पुरा गर्न मद्दत गर्दछ ।

प्रारम्भिक विवरण अनुसार हिब्रुबाट ग्रीक हुँदै ल्याटिनमा र ग्रीक र ल्याटिनबाट अङ्ग्रेजीमा गरिएको अनुवाद अध्ययनको इतिहास निकै लामो छ । सन्त जेरोम अर्थात् युसेबियस सोफ्रेनियस हिएरोनिमसले अरामाइक र ग्रीकबाट बाइबललाई ल्याटिन भाषामा अनुवाद गरेको सम्झना स्वरुप इस्वीसम्बत ४२० सेप्टेम्बर ३० लाई आधार मानेर सेप्टेम्बर ३० का दिन विश्व अनुवाद दिवस मनाउने गरिन्छ ।

पूर्वीय साहित्यसँग सम्बन्धित अनुवादको हकमा इसापूर्व ३३० भन्दा अघिदेखि नै तक्षशिला विश्वविद्यालयमा संस्कृत, हिब्रु, ग्रीक र अरामाइक भाषा पढाइ हुन्थ्यो र ती ती भाषामा अनुवाद गर्ने गरिन्थ्यो भन्ने कुरा इतिहासमा भेटिन्छ ।

इसापूर्व ३२६ मा अलेक्जान्डर महान, उनका सेनापति सेल्युकस विजयी, अलेक्जान्डरका धार्मिक गुरु र आचार्य विष्णुगुप्तबिच तक्षशिला विश्वविद्यालयमा दोभासे राखेर अन्तराष्ट्रिय कूटनीतिक सम्वाद भएको थियो भनेर वी के चतुर्वेदीले चाणक्य २००१ भन्ने पुस्तकमा उल्लेख गरेका छन् ।
आजको हामीले पढ्ने गरेको इतिहास पनि अनुवाद कै माध्यमबाट सिर्जना भएको हो । अनुवाद बेगर ज्ञान आदान प्रदान इतिहासमा पनि सम्भव थिएन र आज पनि छैन । आजको विश्व बजार अनुवादमा टिकेको छ भन्दा अत्युक्ति नहोला । किनभने भाषा नै सम्प्रेषणको माध्यम भएकाले निर्यात सामग्री बेच्नका लागि उत्पादन सामग्रीमा लिखित वा आवाजसहितको जानकारी र विज्ञापन राखेर प्रचार गर्ने हो भने छोटो समयमा पनि निकै ठूलो बजारमा प्रवेश गर्न सकिन्छ भन्ने कुरा जापानिज, चाइनिज, कोरियन आदि भाषाले प्रमाणित गरिदिएका छन् ।

आधुनिक विश्व बजारको प्रचार सामग्री अनेक भाषामा उत्पादन गर्नुपर्ने हुनाले विज्ञापनको बजार पनि अनुवादमा आधारित हुन्छ । आजको अनुवाद बजार एक वा दुई देशमा मात्र होइन अन्तर्राष्ट्रिय क्षेत्र मै उद्योगको रुपमा देखा परेको छ । हामीले पनि बेलैमा सोचेनौँ भने अन्तर्राष्ट्रिय बजारमा प्रवेश गर्न मुस्किल पर्छ ।

यातायात र संचार प्रविधिको विकासको कारणले सन्सार विश्वव्यापीकरण वा ग्लोबललाइजेशनको दिशामा अघि बढेको छ। विश्वव्यापीरुपमा वृद्धि भएको अन्तर्राष्ट्रिय व्यापार, विचार, सामाजिक र सांस्कृतिक पहलुहरु आपसमा सम्बन्धित हुन्छन् । विश्व तापमान वृद्धि वा ग्लोबल वार्मिङ, नदी वा पानीको बहुदेशीय सीमा, वायु प्रदूषण र सागर महासागरमा भएका जलचर प्राणीको संरक्षण जस्ता विश्वव्यापी चुनौतीहरू विश्वव्यापीकरणसँग जोडिएका छन् । तर, विश्वव्यापीकरण अवधारणाको जटिलता, विभिन्न अनुसन्धान, द्विराष्ट्रिय बहुराष्ट्रिय परियोजनाहरू वा समग्र वैश्वीकरणका छलफलहरू एक पक्षीयरुपमा केन्द्रित भएका छन् ।

वैश्वीकरण स्थानीय, राष्ट्रिय र क्षेत्रीय मामलासँग सम्बन्धित हुनुपर्ने हो । तर विश्व व्यापारमा सञ्चार प्रविधि वा सूचना सञ्जाल अर्थात् नेटवर्कको विकासले विभिन्न देशहरूबीच व्यापार, विनिमय आदिमा वृद्धि त भएको छ । तर विकासशील देशहरूको लागि प्रविधिमा उचित सहयोग र प्रशिक्षण प्रदान हुन नसकेको कारणले अर्थतन्त्र, शिक्षा र संस्कृतिमा धेरै पछि परेका छन् । प्रविधिमाथिको पहुँचको अभावले यस्तो स्थितिको सिर्जना भएको हो । किनभने प्रविधि स्थानीयकरणले अर्थतन्त्र, शिक्षा र संस्कृतिमा ध्यान पुर्‍याउन सक्छ । जस्तै भाषिक संस्था भनेको राजनीतिक संस्था वा संस्कृतिको रूपमा स्थापित संस्था होइन तर विकसित देशहरुको भाषिक संस्थाले राजनीतिक संस्थाको काम गरेको अवस्था छ । विकसित देशको भाषाले अन्तर्राष्ट्रिय राजनीतिक प्रसारमा ठुलो योगदान गरेको छ ।

भाषा र संस्कृतिले व्यक्तिहरूलाई विस्तारित सामाजिक परिवेशमा भाग लिन सक्षम बनाउँछ । सामाजिक सम्बन्धको निर्माण र विस्तार भौतिक कुरा होइन । सांस्कृतिक वैश्वीकरणले मानव ज्ञानका साझा मानदण्डहरू निर्माण गरेर व्यक्तिगत र सामूहिक सांस्कृतिक पहिचानलाई जोगाउनु पर्ने हो । तर विकसित वा सम्पन्न भनिने देशहरूको भाषा, विचार, शैली, धर्म, प्रविधि र सांस्कृतिक प्रसार वा फैलावट एक पक्षीय देखिन्छ । युनेस्कोको २००२ को प्रतिवेदन अनुसार पश्चिमी देश भाषा र सांस्कृतिक वस्तु र सेवाका निर्यातक हुन् । बेलायत र अमेरिकापछि चीन र कोरिया जस्ता देशहरू भाषिक र सांस्कृतिक वस्तुका निर्यातक देशका रुपमा अगाडि आएका छन् । यी देशहरूमा भाषा उद्योगले भाषाको व्याख्या, उपलेखन र स्थानीयकरण, भाषा प्रशिक्षण, मेसिन अनुवाद, डविङ, भाषिक सफ्टवेयर र वेबसाइट वैश्वीकरण, भाषाप्रविधि उपकरणबाट अन्तर्राष्ट्रिय सम्मेलन, भाषा शिक्षा र भाषा परामर्शको गतिविधि ह्वात्तै बढेको छ ।

भाषा र संस्कृति जोगाउन वा सबल बनाउन प्रविधि स्थानीयकरण नै सबभन्दा बलियो उपकरण हो । किनभने प्रविधि स्थानीयकरणमा लक्ष्य भाषाको संस्कृति समावेश हुन्छ जसले स्थानीय आवश्यकताहरुलाई अनुकूलित गर्न मनग्गे ध्यान दिइएको हुन्छ । स्थानीयकरण प्रक्रिया सामान्यतः सांस्कृतिक अनुकूलन र स्थानीय भाषामा सफ्टवेयर निर्माण, अडियो, भिडियो, खेलहरू, वेबसाइटको अनुवाद, मानव कम्प्युटर इन्टरफेस, मल्टिमिडिया सामग्री आदि स्थानीय भाषामा हुनुपर्छ । सांस्कृतिक वैश्वीकरणले विश्वभरका विचार, अर्थ, सामाजिक सांस्कृतिक प्रतिमानहरूको प्रसार तीव्र बनाउँछ।

भाषा स्थानीयकरण र मेसिन अनुवादले स्थानीय भाषा र संस्कृति सम्बर्द्धनमा महत्वपूर्ण योगदान पुर्‍याउँछ । भाषिक अनुवादले सांस्कृतिक अनुकूलन मात्र नभएर व्यापार एवं वाणिज्यको क्षेत्रमा समेत ठुलो योगदान दिनसक्छ । नेपालमा पनि अङ्ग्रेजी लगायत युरोपियन र खाडी मुलुकका देशहरूसँग आर्थिक सामाजिक कारोबारले गर्दा दैनन्दिन व्यवहारमा बहुभाषिक बजार बढ्न थालेको छ । बहुभाषी देशसँग व्यापार गर्न बहुभाषी बजार नीति अवलम्बन गर्नु जरुरी हुन्छ । एकल भाषाको माध्यमबाट विदेशी बजारसँग प्रतिस्पर्धा गर्न सकिँदैन ।

भाषाप्रविधिका स्थानीय प्रणालीहरू सक्षम भएमा मेसिन अनुवादले मानव अनुवादकहरूलाई विस्थापित गर्ने होइन यसले त मानव जनशक्तिलाई सहयोग पुर्‍याउने सहयोगी उपकरणको रूपमा काम गर्दछ । हाल अमेरिका, युरोप, क्यानडा, चीन र भारतमा दैनिक ३११ ओटा भाषामा अनुवादको काम हुन्छ भनिएको छ । एउटा कम्पनीले सरदर एउटा भाषामा प्रतिघन्टा तीन हजार शब्द अर्थात् करिब तीनसय चौँतिस वाक्य अनुवाद हुन्छ भन्ने अनुवाद उद्योगको दावी छ । वि. सं. २०११ मै भारतमा मात्र वार्षिक पाँच सय सोह्र मिलियन डलर रकम बराबरको अनुवादको काम भयो भनेर द हिन्दु पत्रिकाले लेखेको छ ।
तर नेपालमा चाहिँ मेसिन अनुवादले मात्र होइन भाषाप्रविधिले नै प्रवेश पाएको छैन । प्रशोधित बहुभाषिक लगतको अभाव छ । भाषाप्रविधिको एउटा पक्ष मेसिन अनुवाद हो र यो अन्तर्विषयक विधा हो । मेसिन अनुवाद भाषाविज्ञान र कम्प्युटर विज्ञानको संयोजित रुप हो । हालसम्म नेपाली भाषामा मेसिन अनुवादका चुनौतीहरू पहिचान गर्न सकिएको छैन । मेसिन अनुवादका लागि निश्चित भाषा नीतिको आवश्यकता पर्दछ । मेसिन अनुवादका केही पूर्वसर्तहरु हुन्छन् । जस्तै- नेपाली भाषाको हकमा भाषा इन्जिनियरिङको कुरा गर्दा भाषा प्रशोधनमा भाग लिने भाषिक घटक वा एकाइकै टुङ्गो लागेको छैन । जस्तै वर्ण निर्धारण; नेपालीमा हालसम्म ण, ञ, ष, ऋ हटाउने कि राख्ने कुराले निकास पाएको छैन । अर्को हो वर्णानुक्रम निर्धारण; सङ्केत चिह्न, ऋ, शिरविन्दु, चन्द्रविन्दु, विसर्ग, हलन्त आदिको क्रम निर्धारण भएको छैन । यस्तै करिब दुईलाख शब्दको मेसिन पठनीय शब्दकोश निर्माण हुनु जरुरी छ । कम्प्युटरमा प्रविष्टि विधि मानक छैन । एएसडिएफजी लेखेर बकमान पढ्ने जमाना जस्ताको तस्तै छ । त्यस्तै दशहजार शब्दको मेसिन पठनीय एकल पर्यायवाची कोश चाहिन्छ । कम्तीमा एकहजार उखान टुक्का कोश चाहिन्छ । दशलाख शब्दको स्थाननाम र व्यक्तिनाम कोश चाहिन्छ ।

अनुवाद नहुने भाषिक एकाइलाई लिप्यन्तरण गर्नुपर्छ । व्यक्तिनाम र स्थाननाम लिप्यन्तरण गर्न नास नहुने वा लसलेस एकुरेसीसहितको देवनागरी रोमनाइज्ड लिप्यन्तरण प्रारुप चाहिन्छ । दश करोड शब्दको दुईभाषिक वा बहुभाषिक पाठ भण्डार, त्यसलाई पढ्ने व्याकरणिक कोटिका ट्याग, दश लाख दुईभाषिक वा बहुभाषिक वाक्य सङ्ग्रह, नेपाली र अङ्ग्रेजी वाक्य पार्सर आदि निर्माण गर्नुपर्छ । यस्तो काम कुनै व्यक्ति वा एउटा दुइटा संस्थाले मात्र गर्न सक्दैन । मेसिन अनुवादका आधारभूत सर्त पुरा गर्नसके नेपालबाटै २७ भन्दा बढी विदेशी भाषामा बौद्ध शिक्षाको पाठ अनुवादको काम गर्न सकिन्छ भने संस्कृत भाषामा हुने अनुवादको विश्व बजार हामीले लिन सक्छौँ । यसलाई सम्बोधन गर्न नेपालमा एउटा अनुवाद नीति र साथै मेसिन अनुवाद नीतिको अभाव खट्किएको देखिन्छ ।

मेसिन अनुवादको फाइदा के छ भने एक पटक प्रयोग गरेको लगत वा डाटा पुनः प्रयोग गर्न सकिन्छ । दोस्रो तेस्रो पटक अनुवाद गर्दा प्रशोधित डाटा थपिँदै जान्छ र पछिल्लो अनुवादमा समतुल्यता बढ्दै जान्छ । अनुवादको पटक जति बढ्दै जान्छ त्यति नै मेसिन अनुवाद पछिको मान्युअल सम्पादनको काम घट्दै जान्छ । अत्यन्त थोरै समयमा अनुवाद हुन्छ । हिजोआज अनुवादले बजार र प्रविधिमा समेत दरो उपस्थिति जनाइ सकेको छ । अनुवादको सन्दर्भमा बजार र प्रविधिलाई ध्यान नदिने हो भने अन्य भाषाको ज्ञान आर्जनमा अवरोध हुने मात्र होइन विश्वबजारसँग प्रतिस्पर्धा गर्न पनि सकिँदैन । नेपाली भाषाको हकमा अनुवाद प्रविधिको स्थितिलाई हेर्दा भाषा भण्डारमा प्रविधिको ग्रहण लागेको अवस्था छ ।

प्रतिकृया लेख्नुहोस्:

सम्बन्धित शीर्षकहरु

आजको लोकप्रिय

NTC
Vianet
Sajhajob