scheduleसोमवार आषाढ़ ११ गते, २०७५

नेपालमा भाषा कम्प्युटिङ र कल्पनाको लड्डू

भाषा, प्रविधि र भाषाप्रविधि

नेपालमा भाषा कम्प्युटिङको कुरा र मनको लड्डु घिउसँग खाने कुरा उस्तै-उस्तै हुन् । मनको लड्डु घिउसँग खाने कुराको त परिभाषा गरिरहन पर्दैन । तर, भाषा कम्प्युटिङलाई कसरी परिभाषित गर्ने वा भाषा कम्प्युटिङ भनेको केहो भनेर केही ब्याख्या गर्नैपर्ने हुन्छ । भाषा कम्प्युटिङ भनेको विद्युतीय मेसिन वा मेसिन प्रविधिको माध्यमबाट भाषा र व्याकरण विश्लेषण गर्ने र कृत्रिम बुद्धिका सहायताले सूचना प्रविधिमा स्वचालितरूपमा भाषाको प्रयोग गर्ने प्रविधिलाई भाषा इन्जिनियरिङ वा भाषा प्रविधि भन्ने गरिन्छ ।

प्राकृतिक भाषा अध्याहार (नेचुरल ल्याङ्ग्वेज प्रोसेसिङ) को क्षेत्र भनेको भाषाको विद्युतीय विश्लेषणको क्षेत्र हो । प्राकृतिक भाषा अध्याहारको विश्लेषण प्रयोजनका लागि कृत्रिम बुद्धिको आवश्यकता पर्छ जसलाई अङ्ग्रेजी भाषामा आर्टिफिसियल इन्टेलिजेन्स भनिन्छ । यही कृत्रिम बुद्धिका सहायताले कम्प्युटरले प्राकृतिक भाषा बुझ्दछ । यसलाई नै अङ्ग्रेजीमा प्राकृतिक भाषा अध्याहार (नेचुरल ल्याङ्ग्वेज प्रोसेसिङ वा एनएलपी) का नामले चिनिन्छ । प्राकृतिक भाषा अध्याहार निश्चित मूल्य र मानकमा आधारित हुन्छ । कम्प्युटरले मानवले जस्तै भाषा अध्याहार गर्न सक्ने कार्यलाई प्राकृतिक भाषा अध्याहारको लक्ष्यका रूपमा लिने गरिन्छ । त्यसैले प्राकृतिक भाषा अध्याहारका लागि कुन भाषाको अध्याहार गरिने हो त्यस भाषाको सार्वभौम वर्ण सङ्केतन पद्धति निर्धारण गर्नु सबभन्दा पहिलो काम हो । नेपालमा भाषा इन्जिनियरिङको सुरुआत भई नसकेतापनि समयक्रमसँगै यसबारे प्रविधि अध्येता र सरकारको ध्यान जाला भन्ने कुरामा आस चाहिँ राख्नै पर्छ । सरकार, देशका जिम्मेवार शैक्षिक संस्था, नास्ट, नेपाल प्रज्ञा प्रतिष्ठान जस्ता संस्थाको आँखामा मोतिविन्दु लागेको अहिलेको बेलामा पर्खिनु सिवाय केही गरिहाल्ने वा यसबारे कसैले सुनीदेला भन्ने अवस्था छैन ।

डा. लक्ष्मीप्रसाद खतिवडा

स्थानीयकरण (लोकलाइजेसन) को बढ्दो विश्वव्यापी प्रभावलाई मानकीकरण गर्दै भाषाको जटिलता हटाउने उद्देश्यले नेपालमा पनि सूचना प्रविधि उच्चस्तरीय आयोग अन्तर्गत सूचना प्रविधिमा नेपालका भाषाहरू (एनएलआइटी) को स्थापना भएको थियो । नेपालमा कम्प्युटरको व्यवसायिक प्रयोगको सुरुआत राष्ट्रिय जनगणनाबाट थालनी भएको पाइन्छ । मेनफ्रेम कम्प्युटर भाडामा ल्याएर कम्प्युटरबाट सूचना भण्डारण र प्रशोधनको काम गर्न थालेको तीन दशक नाघिसक्यो । मेनफ्रेम, मिनिफ्रेम, डेस्कटप कम्युटर, काखे (ल्यापटप) कम्प्युटर र मोबाइल कम्प्युटिङसम्मको यात्रामा प्रविधिका क्षेत्रमा महत्वपूर्ण मानकहरूको निर्माण भइसक्नु पर्ने हो । तर सूचना प्रविधिको काम अङ्रेजी भाषाका माध्यमबाट मात्र हुने गरेकाले साधारण जनतामा कम्प्युटर हाम्रा लागि बनेको होइन भन्ने धारणाले जरो गाड्यो ।

कम्प्युटर प्रविधिमा धरै लामो समयसम्म एउटा एकलकाँटे सोचाइले जरा गाड्यो । त्यो के भने ‘कम्प्युटरको मातृ भाषा भनेको अङ्ग्रेजी भाषा हो’ । यही सोचाइका बलले कम्प्युटर ब्यवसायका क्षेत्रमा बिल गेट्स जस्ता महासम्राटहरूको जन्म पनि भयो ।

एकातिर साधारण जनतामा प्रविधिप्रतिको बेवास्ता वा यो हाम्रालागि होइन भन्ने छाप कायमै रह्यो भने अर्कातिर कम्प्युटर विशेष प्राविधिक काम बढी हुने सङ्घसंस्थामा मात्र प्रयोग हुने हुनाले सूचना प्रविधिमा स्थानीय भाषाको पहुँच आम जनतासम्म पुर्‍याउने कुरामा सरकारी वा व्यक्तिगत तवरबाट पनि सोचाइ नै रहेन । कम्प्युटर प्रविधिमा धरै लामो समयसम्म एउटा एकलकाँटे सोचाइले जरा गाड्यो । त्यो के भने ‘कम्प्युटरको मातृ भाषा भनेको अङ्ग्रेजी भाषा हो’ । यही सोचाइका बलले कम्प्युटर ब्यवसायका क्षेत्रमा बिल गेट्स जस्ता महासम्राटहरूको जन्म पनि भयो ।

हामीकहाँ कम्प्युटर सञ्चालनको सक्कली संस्करण (भर्सन) समेत चलाउने परिपाटी छैन । यसको विकल्प सोच्नुभन्दा यही प्रविधिको लाइसेन्स नम्बरको अवैधानिक नक्कल गरी पाइरेटेड सफ्टवेयरका रूपमा प्रयोग गर्ने परिपाटी मौलाउन थाल्यो । सक्नेले सक्कली सफ्टवेयर किनेर चलाउने र आम प्रोयोगकर्ताले पाइरेटेड सफ्टवेयरनै चलाउने परिपाटी धेरै लामो समयसम्म रहिरह्यो । वर्तमान समयमा पनि हुने र सक्नेले मात्र सक्कली सफ्टवेयर चलाउँछन् र अधिकांश तल्लो तहका सरकारी कार्यालय र सर्वसाधारणले त पाइरेटेड सफ्टवेयरनै चलाउने गर्छन् ।

सन् ८० को दशकमा छिटफुट रूपमा र ९० को दशकमा योजनाबद्ध रूपमा लिनक्स सञ्चालन प्रविधिमार्फत खुला स्रोत सफ्टवेयरको विकास हुन थालेपछि माइक्रोसफ्टको पाइरेटेड सफ्टवेयरका अलावा खुला स्रोत सफ्टवेयरको प्रचलन आउन थालेको हो तर पनि सामान्य जनमानससम्म पुग्न सकेको छैन । उम्दाखालका कम्प्युटर इन्जिनियरहरूले भने लिनक्समा रुची राख्न थालेको अवस्था छ । जसले गर्दा अङ्ग्रेजीभन्दा अन्य भाषामा पनि अङ्ग्रेजीमा जस्तै समानान्तर रूपमा कम्प्युटर चलाउन सकिन्छ भन्ने सोच पलाउन थाल्यो ।
अङ्ग्रेजी कम्प्युटरको मातृभाषा हो भन्ने दूषित धारणालाई पखाल्न यसले ठूलो मद्दत पुर्‍यायो ।

देशमा छुवाछुतको भेदभाव त हटिसक्यो तर कम्प्युटर प्रविधिमा अझै बाँकी रहेछ । कम्प्युटर प्रविधिमा यस्तो आमधारणा रहेसम्म भाषा कम्प्युटिङको त के कुरा नेपालीमा टाइप गरेको कुरा विदेशमा वा दूरदराजको कुनै ठाउँमा बसेर हेर्नु पर्‍यो भने यो वा त्यो फन्ट चाहिने रोगले छाड्दैन ।

विश्वव्यापी एकीकृत सङ्केतन प्रणाली (युनिकोड) को विकासपछि नेपालमा पनि देवनागरी युनिकोडको निर्माण गरी सूचना प्रविधिमा नेपाली भषालाई भित्र्याउने काम सुरु भयो । खुलास्रोत सफ्टवेयर प्रणालीमा आधारित लिनक्स प्रविधिअन्तर्गत मदन पुरसकार पुस्तकालयले नेपाली भाषाकै माध्यमबाट कम्प्युटर सञ्चालन प्रणालीको विकास गर्‍यो भने अनलिमिटेड नुमिडिया प्रालिले नेपाली भाषाका माध्यमबाट माइक्रोसफ्ट अफिस प्रणालीको विकास गर्‍यो । नेपालमा भाषा कम्प्युटिङको आधार वा स्थानीयकरणको ऐतिहासिक विकास यसरी भएको देखिन्छ । तर अन्तर्राट्रिय मानक सङ्गठनसँग सहकार्यका अभावमा नेपाली कम्प्युटिङ कार्य अगाडि बढ्न सकेन ।

हाल नेपालमा सूचना प्रविधिका क्षेत्रमा धेरै ठूला ठूला काम उदाहरणका लागि इ-सरकार, इ-प्रशासन, इ-कानुन, इ-दूरकेन्द्र, इ-शिक्ष र सन्सारको सूचना प्रविधिसँग सीधा सम्पर्क जोड्ने डाटाकेन्द्रको निर्माणजस्ता काममा सरकारले विशेष ध्यान दिइरहेको भनिएको छ तर साना साना कुरा गर्न भने बाँकी नै छ । कुञ्जीपाटी (किबोर्ड) मानकीकरण, इनपुट (प्रविष्टि) मानकीकरण, लगत (डाटा) सङ्केतन मानकीकरण, पुरानो लगत (डाटा) रुपान्तर प्रकृयाजस्ता साना तर आधारभूत कुरा भने केही पनि भएको छैन । भब्य महल बनाउने काम भइरहेको छ तर सतहमाथि पर्खाल उठाएर । जग हाल्न र पिलर गाड्न चाही बाँकी नै छ ।

भाषा कम्युटिङको कुरा गर्दा प्रविष्टि (इनपुट) मानकीकरण नभईकन सम्भव हुँदैन । पुरानो प्रणालीमा जस्तो टाइप गर्दा एकथोक देखिने तर कम्प्युटरभित्र अर्कै सङ्केतन पद्धतिबाट सङ्ग्रह हुने प्रणाली भएसम्म भाषा कम्युटिङ सम्भव हुँदैन । यसै सिलसिलामा यहाँ विगत केही महिना अगाडिको प्रसङ्ग निकाल्न मन लाग्यो । कुरा के रहेछ भने त्रिभुवन विश्वविद्यालयमा एकजना विद्यार्थीलाई नेपाली साहित्यको शोधपत्र बुझाउनु पर्ने रहेछ । उनले शोधपत्र देवनागरी युनिकोडमा टाइप गरेर बुझाएछन् । तर शोध निर्देशक प्राध्यापक महोदयले सोझै अस्वीकार गर्नुभएछ । विचरा विद्यार्थीले पुनः प्रीति फन्टमा टाइप गरेर लगे पछि शोधपत्र स्वीकृत भएछ ।

देशमा छुवाछुतको भेदभाव त हटिसक्यो तर कम्प्युटर प्रविधिमा अझै बाँकी रहेछ । कम्प्युटर प्रविधिमा यस्तो आमधारणा रहेसम्म भाषा कम्प्युटिङको त के कुरा नेपालीमा टाइप गरेको कुरा विदेशमा वा दूरदराजको कुनै ठाउँमा बसेर हेर्नु पर्‍यो भने यो वा त्यो फन्ट चाहिने रोगले छाड्दैन ।

सम्विधानत: नेपालका सम्पूर्ण भाषाहरूले नेपालको राष्ट्रभाषाको मान्यता पाइसकेको वर्तमान परिवेशमा नेपालीमा मात्र कम्प्युटरमा काम गर्न सक्ने भएर पुग्दैन । बहुभाषामा काम गर्ने वातावरण बनाउन हाल नेपाली वा अङ्ग्रेजीमा भएका कामलाई सहज रूपमा र प्लेटफर्म अनाधारित मानक फर्म्याटिङ प्रणालीमा ढाल्न जरुरी छ । यसो गर्नाले भोली अर्को भाषामा काम गर्दा त्यही कुरा पुन दोहोर्‍याउन पर्दैन ।

उदाहरणका लागि आज अङ्रेजी वा स्पेनिस जुन भाषामा भएपनि भाषा रुपान्तरको समस्या छैन । महिनौ वा वर्षौँ लगाएर बनाएको अनुप्रयोग १/२ दिनमा रुपान्तर गर्न सक्ने अवस्था छ । यसो गर्नलाई भाषा कम्प्युटिङको सहायोग लिन सकिन्छ । कम्प्युटरमा प्रविष्टिदेखिनै निश्चित मानक प्रणाली अपनाउनु पर्छ । लगत सङ्केतन संहिता, भण्डारण प्रकृया तथा त्यसको एकरूपीकृत फर्म्याटिङ प्रणालीले भोली त्यो लगतलाई सजिलै रुपान्तर गर्न सकिन्छ । सूचना प्रविधिका नीति निर्माताका दिमागमा यो कुरा छिर्न सके हिजोआज गरेको काम भविष्यमा पुन दोहोर्‍याइरहन पर्दैनथियो र चाँडैने भाषा कम्प्युटिङको सुरुआत हुने कुरामा विश्वस्त हुन सकिने थियो ।

भाषा मानकीकरण गरी कम्प्युटरमा वा प्रविधिमा सक्षम बनाउन सके भाषाको मात्र होइन सम्पदा संरक्षणमा समेत मद्दत पुग्छ । देशको सम्पदा स्थानीय ज्ञान सामग्रीमा निहित हुनछ । स्थानीय ज्ञानसामग्री भनेको समाजको रक्तसञ्चार हो । यस्तो रक्तसञचारलाई निरन्तरता दिन सूचना प्रविधिमा सरकारी कामकाजको भाषा र सम्पदा, संस्कृतिको ज्ञानभण्डार बनाउन जरुरी हुन्छ । यस्तो ज्ञानभण्डार नभएसम्म नेपालमा भएको यावत काम भनेको विदेशी ऋण लिएर विदेशी आइएनजिओ र इन्टर गभर्न्मेन्टल कमिटीलाई डाटा उपलब्ध गराउने कामभन्दा बढी केही हुन सक्दैन । ऋण नेपालीको थाप्लामा डाटा विदेशीको पोल्टामा बस यत्ति नै हो ।

कतिपय अल्पविकसित देशले प्रविधिका माध्यनबाट भाषा र संस्कृति जोगाउन राष्ट्रिय नीति तथा ऐन बनाएर प्रयास गरिरहेका छन् । यस्ता प्रविधिहरूमा सूचना प्रविधि सबभन्दा महत्वपूर्ण हतियार हो । आजको ज्ञान मानिसको टाउकाले बुझेरमात्र पुग्दैन । यस्तो ज्ञान धातुको टाउकाले वा कम्प्युटरले समेत बुझ्न सक्ने हुनुपर्छ । कम्प्युटर सक्षम भाषा सूचना प्रविधिको अभिन्न अङ्ग भएकाले सूचना प्रविधि नीतिमा नेपाली र नेपालका भाषाको ज्ञानसामग्री भण्डारण गरेर राख्नै पर्छ । तर नेपालको हकमा त भाषा, ज्ञानसामग्री र इतिहासको वास्तविक अध्ययन गर्ने गराउने परिपाटी देखिदैन भने भाषा कम्प्युटिङको कुरा त न नेताले बुझ्छन् न कर्मचारीले ।

नेपाल सूचना प्रविधिको वैश्विक परिदृश्यमा निम्नस्तरमा देखिए तापनि सन्सारभर सूचना प्रविधि विकासको तीव्र परिवर्तनका कारण भाषा प्रविधिले महत्त्वपूर्ण भूमिका खेलिरहेको छ । सूचना प्रविधिको विकास र परिवर्तनसँग समन्वय गर्न भाषा प्रविधि सहितको सूचना प्रविधि नीति आवश्यक छ । सफ्टवेयर घटक, सङ्केतन पद्धति र स्थानीय सामग्रीको निर्माण आदिको ग्यारेन्टी गर्न भाषा प्रविधि नीति सुनिश्चित गरेर स्थानीय भाषामा प्रविधिको पहुँच, विद्युतीय सामग्री निर्माण, स्थानीय सामग्रीको अन्तर परिवर्तनीय क्षमता आदिका लागि पहुँच योग्य बनाउनु पर्दछ ।

सूचना पाठक, दर्शक वा श्रोताले बुझ्ने भाषामा उपलब्ध हुनुपर्छ भन्ने मान्यतालाई अवलम्वन गरी संयुक्त राष्ट्र सङ्घले राज्यपक्ष भएका देशहरूमा संयुक्त राष्ट्र सूचना केन्द्र स्थापना गरेको छ । संयुक्त राष्ट्र सङ्घले साझेदार निकायसँग समन्वय गरेर बडापत्र र पक्षराज्यले हस्ताक्षर गरेका अन्तर्राष्ट्रिय सन्धि सम्झौतालाई ती ती देशका भाषामा अनुवाद गरी तत्‌तत् राष्ट्रहरूलाई उपलब्ध गराउनु पर्ने प्रावधान छ । नेपालको हकमा त संयुक्त राष्ट्र सङ्घका बडापत्र र सन्धि सम्झौताहरू नेपाली र अन्य स्थानीय भाषामा अनुवाद गरी आम जनसमुदायमा पुर्‍याउने काम हुन नसकेको मात्र होइन सरकारी कामकाजको भाषा प्रयोग गर्ने नेपाल सरकार समेत अङ्ग्रेजी भाषामा सूचना उत्पादन गर्छ ।

कम्प्युटरमा स्थानीय भाषा र सांस्कृतिक पहिचानको जानकारी निश्चित कोडमा सेट गरिएको हुनुपर्छ । विभिन्न देशहरूमा स्थानीय भाषा र सांस्कृतिक पहिचानको अलग डाटा हुन्छ । भू-स्थानीय सांस्कृतिक लगतमा भौगोलिक स्थानहरू, भाषा र राष्ट्रिय सांस्कृतिक जानकारी, स्थानीय समय, मिति, समयको नाम र समयका ढाँचाहरू, मुद्रा स्वरूप, मुद्रा प्रतीक, सकारात्मक मुद्रा ढाँचा, मुद्राको नकारात्मक गणनाको प्रबन्धन, मुद्रा ढाँचा, दशमलव प्रतीक, अङ्क समूह प्रतीक, स्थानीय भाषा र लिपिका नाम, नम्बर ढाँचाहरू, नम्बर प्रतीक, नम्बर प्रणाली, शहरका नाम आदि आधारभूत कुराहरूलाई स्पष्ट मानक स्वरूपमा सेटिङ गर्नुपर्छ । यसको समन्वय गरी कार्‍यान्वयनमा लान नेपालमा आइएसओ प्रमाणीकरण गर्ने निकाय पनि छैन । चाउचाउ, साबुन, सिमेन्ट र छडको मानक चाहिँ गुणस्तर विभागले हेर्छ ।

सूचना प्रविधिको परिवर्तनले गर्दा सन्सार द्रूत गतिले परिवर्तन हुँदैछ तर नेपाल सरकारले सूचना प्रविधि नीतिमा सरकारी कामकाजको भाषा र देशका अन्य राष्ट्रभाषाको पहुँच पुर्‍याउन पटक्कै काम गरेको छैन । सूचना प्रविधिका मूल्यमान्यतालाई समाज उपयोगी बनाउन राष्ट्रिय योजना आयोगमा कुनै नीति तथा कार्यक्रम छैन । सूचना प्रविधिमा लोकसेवा, सरकारी र साझेदार कम्पनी, आपूर्ति व्यवस्था, कर्मचारी र ग्राहकबीचका कार्यसम्पादनका तथ्याङ्कहरूमा अन्तरपरिवर्तनीयताको अभाव छ ।

नेपालका जनता मात्र अभागी भन्ने कुरा सत्य होइन रहेछ देशै अभागी रहेछ । सूचना पद्धतिमा व्यवस्थित वा राम्रो काम हुन दिइँदैन । संस्थागत काम हुनलाग्यो भने जरैसमेत उखेलेर फ्याँलिन्छ । राष्ट्रिय कम्प्युटर केन्द्र तथा सूचना प्रविधि उच्चस्तरीय आयोग समाप्त पारियो । अब पनौतीको सूचना प्रविधि पार्क ब्यापारीलाई बेच्ने चाँजोपाँजो मिलाइदैछ भन्ने समाचार पढेकै हो । विज्ञान प्रविधि मन्त्रालय मासेर विभागमा लाने र विभागबाट महाशाखामा लाने काम त भइनै सक्यो । महाशाखाले खेलकुद र पर्यटन समेत हेर्नुपर्ने हुनाले अलग्गै सूचना प्रविधि फाँट बनाउने कसरत भइरहेको छ ।

स्वदेशी भाषामै इन्टरफेसको निर्माण, परम्परागत संस्कृतिका फोटो साझेदारीदेखि बैंक, ऋण प्रक्रिया, विश्वविद्यालय अनुसन्धानका डाटा स्थानीयकरण, भण्डारण प्रक्रियाको राम्रो व्यवस्था भए आफ्नो देशका डाटा विदेशीले लान पाउदैनन् । तर नेपालको विकासमा स्वदेशी सोचको अभाबले गर्दा डिजिटल अर्थव्यवस्थाका डाटा स्थानान्तरण वा कम्पनीहरूको डाटाको सुरक्षा डाटा भण्डारणमा सरकारको नियन्त्रण छैन । आइजिसीका नाममा गोप्य सूचना खोल्नुपर्छ । डाटा स्थानीयकरण नीति र डाटाको स्थानीयकरण पूर्वाधार विकास हुनसकेको छैन । त्यसैले हाल सूचना प्रविधिका माध्यमबाट हुने विदेशी भाषा र संस्कृतिको हस्तक्षेप रोक्न नसकिने अवस्था छ । यस्तो बेलामा भाषा कम्प्युटिङको कुरा र मनको लड्डु घिउसँग खाने कुरा उद्तै उस्तै हुन् नानु भन्नु सिवाय अरु त के नै पो गर्न सकिन्छ र ।

यो पनि पढ्नुहोस्-

भनीसाध्य छैन भाषाको समस्या

प्रतिकृया लेख्नुहोस्:

सम्बन्धित शीर्षकहरु

आजको लोकप्रिय

NTC
Vianet
Sajhajob