Saturday, February 27, 2010

चेत जाइये वरना युनीकोड बनेगा हमारी एकात्मिक सांस्कृतिक धरोहर को खतरा

चेत जाइये वरना युनीकोड बनेगा हमारी एकात्मिक सांस्कृतिक धरोहर को खतरा

आधुनिक जगतमें संगणकोंने एक अभूतपूर्व क्रांति पैदा की है। ज्ञान, वैज्ञानिकता और प्रगती के हर शिखर के लिय़े प्रयुक्त हर सीढीमें संगणक-तंत्र अत्यावश्यक है। भाषाई विकास भी इसके बिना असंभव है – यह बोध तो कई चिन्तकोंमें आ गया है परन्तु संगणक-लेखन में प्रमाणीकरण एवं समन्वय दोनोंके अभावमें साथही कुछ लापरलाहीसे भारतीय भाषाओंकी समग्र एकात्मता और सांस्कृतिक एकतापर जो बडा संकट मंडरा रहा है उसकी ओर अभीतक किसीने ध्यान नही दिया है।

इस खतरेको दो हिस्सोंमें समझना होगा। पहलेका कारण यह था कि अपार लगन, वैज्ञानिक श्रेष्ठता, और संसाधनोंकी बहुलताके संबलपर जिन्होंने भारतीय भाषाओंके लिये सॉफ्टवेअर बनाये उन्होंने दो आवश्यक कामोंमेंसे एक किया और दूसरेको स्वार्थवश अधूरा छोड रखा। अब भारतीय बाजारका लाभ लेनेके लिये जागतिक युनीकोड कन्सॉर्शियमने ने दूसरा काम तो कर दिया पर पहले कामकी कुछ अच्छाइयोंको बिगाडकर। दोनोंही तरफसे नुकसान है हमारी भाषाका, सांस्कृतिक विरासतका और एकात्मताका।

इसे हम यों समझ सकते हैं कि विश्वमें भाषाएँ और लिपियाँ कई हैं लेकिन वर्णमालाएँ केवल चार है ---
(1) ब्राह्मी – जिससे देवनागरी (संस्कृत), अन्य सारी भारतीय लिपियाँ, साथही सिंहली, थाई, तिब्बती, इंडोनेशियन और मलेशियन लिपियाँ बनीं।
(2) चीनी – जिससे चीनी, जपानी एवं कोरियाई लिपियाँ बनीं।
(3) फारसी – जिससे फारसी, अरेबिक एवं ऊर्दू लिपियाँ बनीं।
(4) ग्रीक, लैटिन रोमन व सिरिलीक – जिनमें आपसमें थोडासा अन्तर है और जिनसे तमाम पश्चिमी एवं पूर्वी युरोपीय लिपियाँ बनीं।

प्रत्येक वर्णमालामें अक्षरोंका वर्णक्रम सुनिश्चित है। भारतकी सभी भाषाओंका वर्णक्रम एक ही है जिसका ढाँचा ध्वन्यात्मक है। यदि इस विशेषताको टिकाये रखकर तथा उसका लाभ उठाते हुए हमने संगणकीय लिपी-प्रमाणक बनाये और उन्हें अनिवार्य घोषित कर पायें तो हमारी सांस्कृतिक एकात्मताकी अंतर्निहित शक्ति एवं वैज्ञानिकताके कारण हम लम्बी छलाँग लगा सकते हैं अन्यथा इसको नजरअंदाज कर हम अपनी एकात्मिक सांस्कृतिक धरोहरको एक झटकेसे गँवा भी सकते हैं। आज हम दूसरे खतरेके बगलमें खडे हैं जिसके प्रति हमें शीघ्रतासे चेतना होगा।

पर पहले देखें कि आज संगणक पर भारतीय भाषाएँ कहाँ हैं। अपने संगणकपर जाकरयह सिक्वेन्स टिकटिकाएँ – स्टार्ट  सेटिंग  कण्ट्रोल पॅनल  रिजनल ऍण्ड लॅन्गवेज 
तो आपको एक ड्रॉप-डाउन मेनू दिखेगा जिसपर बाय डिफॉल्ट लिखा होगा EN अर्थात् इंग्लिश. उसके पूरे मेनूमें देखनेपर आपको भारतीय भाषाओंके सिवा हर भाषाका ऑप्शन दिखेगा – फ्रेंच, अरेबिक, चायनीज, स्वाहिली, थाई, रशियन, सिरीलिक, कोरियाई,....। यह हालत तब है जब विश्वकी सर्वाधिक बोली जानेवाली बीस भाषाओंकी गिनतीमें पाँच भारतीय भाषाएँ हैं -- हिन्दी, बंगाली, मराठी, तेलगू और तमिल। फिर भी भारत की किसी भाषा को वहाँ स्थान न मिलने का कारण क्या हो सकता है ? जरा सोचें – यह कारण है हमारी अकर्मण्यता, अदूरदर्शिता, स्वार्थ, अहंकार और न जाने क्या क्या। तो उन्हें परे ठेलकर भारतीय भाषाओंको वहाँ प्रस्थापित करनेका बीडा उठा सके ऐसा कौन होगा?
पहले खतरेको विस्तारसे समझना
अब देखते हैं इस दुर्घटनाका इतिहास अर्थात् पहले खतरेको विस्तारसे समझना। पहले हम समझें कि लेखन-प्रक्रिया के तीन मीलके पत्थर अर्थात् कागज-कलम, टाईप-रायटर और संगणक में क्या अंतर हैं। जब हम कलमसे कगजपर लिखते हैं, तो मनमें जैसेही एक शब्द उभरता है, उसी समय मनके पटलपर उसका एक दृश्य-स्वरूप भी उभरता है और वही दृश्य-स्वरूप हाथसे कागजपर लिखा जाता है। जब टाइपरायटर बने तो हमने दो बातोंको अलग-अलग पहचानना सीखा – कि दृश्य-स्वरूप क्या होगा और निर्दश-तंत्र (अर्थात् किस अक्षरके लिये किस कुंजीको दबाना है) क्या होगा। निर्दश-तंत्रकी उपयोगिताके लिये कुंजीपटलके प्रमाणीकरणकी आवश्यकता भी अनिवार्य़ हुई। जब संगणक आया तो उसमें निर्देश-तंत्र और दृश्य-स्वरूप के बीचमें एक और कडी जुड गई जो संग्रह-व्यवस्था की कडी है। अतः यह जरूरी हो जाता है कि हम इस संग्रह-व्यवस्थाको समझें और उसका भी प्रमाणीकरण करें।

यदि हम समझ लें कि संगणककी प्रोसेसर चिप उसके लिये एक मस्तिष्क का काम करती है (जो कि मानवी मस्तिष्कसे हजारोंगुना अविकसित है पर है तो मस्तिष्क ही) तो संगणकके कामको समझना सरल है। उसकी संग्रह-व्यवस्थामें एक भारी मर्यादा है क्योंकि उसका मस्तिष्क अविकसित है। वह हमारी तरह शून्यसे नौ तककी दस इकाइयाँ नही समझता – केवल दो इकाइयाँ समझता है – शून्य एवं एक । तो उसे मानवी भाषा समझानेके लिये हम प्रत्येक अक्षरके लिये आठ-आठ इकाइयोंकी शृंखला बनाते हैं। ऐसे 256 पॅटर्न या अक्षर-शृंखला बन सकते हैं और संगणक अपने अपार क्षमतावाले स्मृति-संग्राहक यानी हार्ड-डिस्कमें उन्हे आठ-आठ इकाइयोंकी शृंखलाके रूपमेंही संग्रहित कर लेता है। अतः इन शृंखलाओंकाभी प्रमाणीकरण अवश्यक है।

इस प्रकार लेखनके विकासके इतिहासमें सैंकडों वर्ष पूर्व दृश्य-स्वरूपका एवं वर्णक्रमका प्रमाणीकरण हुआ। प्रिंटिंग तकनीकका विकास हुआ तब वर्णविन्यास अर्थात् फॉण्टसेटोंका प्रमाणीकरण हुआ, यथा अंग्रेजी के एरियल, टाइम्स न्यू रोमन, कूरियर इत्यादी फॉण्ट, जिनसे दृश्य-लेखनकी सुंदरता एवं विविधता बढती है और फॉण्टफटीग नही पैदा होता। टाइपरायटरोंके कारण निर्देश-तंत्रका अर्थात् कुंजीपटलका प्रमाणीकरण हुआ। हमारा परिचित अंग्रेजी कुंजीपटल क्वर्टी नामसे जाना जाता है क्योंकि उसकी पहली पंक्तिके पहले अक्षर q,w,e,r,t,y (क्वर्टी) क्रमसे आते हैं। इस निर्देश-तंत्रमें रोमन वर्णमाला के परिचित क्रम से भिन्न क्रम रखना पडा ताकि कुंजीकी कडियाँ एकदूसरे में ना फँसे। इस प्रकार मशीनकी सीमा के कारण नया क्रम बनानेकी आवश्यकता आन पडी। इसी प्रकार संगणकके आनेपर आरंभमें कई कंपनियोंने अंग्रेजी वर्णाक्षरोंके लिये अलग अलग निर्देश-समूह बनाये। लेकिन जब यह समझमें आया कि इस कारण लेखन-तंत्रकी एकवाक्यता एवं आदान-प्रदान को खतरा है तो अपने अपने निर्देश-समूहोंको भुलाकर सबने अंग्रेजीके लिये एक स्टॅण्डर्ड अपनाया जिसका नाम था ASCII ।

जब भारतीय लिपियोंके लिये संगणकपर सॉफ्टवेअर बनने लगे तो एक ओर प्राइवेट कंपनियाँ अलग-अलग प्रकारसे सुंदर फॉण्ट, निर्देश-तंत्र और संग्रह-तंत्र बनाने लगीं तो दूसरी ओर भारत सरकारने इनके प्रमाणीकरणके लिये कदम उठाये। 1991 में ISCII नामसे एक प्रमाणक (मानक - स्टॅण्डर्ड) बन भी गया जिसे बनानेमें सरकारी संगणक-कंपनी सी-डॅकका योगदान रहा। इसमें मानकमें कई अच्छाइयाँ थीं।

एक तो इसमें सभी भारतीय भाषाओंको एक सूत्रमें पिरोया गया था। भाषा मल्याली हो या बंगाली – एक अक्षऱका संग्रह-तंत्र एक ही हो और निर्देश-तंत्र भी एक ही हो ऐसी व्यवस्था रखी गई। दूसरी अच्छाई यह थी कि निर्देश-तंत्र अर्थात कुंजीपटलके लिये इन्स्क्रिप्ट नामसे एक क्रम लागू किया जो वर्णाक्षरोंके क्रमानुसार था ताकि स्कूलकी पहली कक्षामें पढाये गये वर्णक्रमसे काम हो सके। तीसरी अच्छाई यह थी कि एक लिपीमें कुछ भी लिखो तो उसे मात्र एक इशारेसे अन्य लिपीमें लिप्यंतरित किया जा सकता था। यह तीनों अच्छाईयाँ अलीबाबा के खुल जा सिमसिमकी तरह थी क्योंकि इसी एकात्मताके कारण आनेवाले कालमें इस बातकी संभावना बन सकती थी कि एक भाषामें महाजालपर डाली गई सामग्रीकी जानकारी दूसरी भाषा में सर्च करनेपर भी मिल जाय। यहाँ यह याद दिला दूँ कि यद्यपि सामान्यजनके काम लायक महाजाल-सुविधा 1995 में आई फिर भी सीमित रूपमें यह पहले भी उपलब्ध थी और इसकी संभावनाओंको हमारे मानक-शास्त्रज्ञ जानते थे। इसी कारण उन्होंने एकात्म सर्च सुविधाका विचार कर मानक बनाया था।

लेकिन इस एक अच्छे कामके बाद सी-डॅककी नियत बदल गई। स्टॅण्डर्डके हिसाबसे सॉफ्टवेअर बनानेसे वह अगले आविष्कार व सॉफ्टवेअरोंके लिये उपयोगी सिद्ध होता – फिर अलग-अलग प्रतिभावाले लोग उससे और भी अगला काम करते और भाषा-विकासमें बडी सहायता मिलती। इसके बजाय सी-डॅकने अपनी उपलब्धिसे आर्थिक कमाईकी नीति अपनाई। स्टॅण्डर्डकी अवधारणाको धता बताकर गोपनीय संग्रह-तंत्र बनाया और दूसरी सॉफ्टवेअर कंपनियोंके साथ स्पर्धा बनाने में जुट गई। फिर सरकारभी किसीपर सख्तीसे स्टॅण्डर्ड नही लागू कर पाई। सभीने अपने भाषाई सॉफ्टवेअर ऊँचे दामोंमें बेचे। 1990-95 में जब अंग्रेजी गद्य-लेखनका सॉफ्टवेअर 500 रुपयेमें दिया जाता वहीं भाषाई सॉफ्टवेअरकी कीमत 15000 रुपये होती थी (आज भी है)। इस प्रकार बाजारके गणितने भाषा-विकासको पीछे धकेल दिया। राजभाषाकी हमारी सारी दुहाइयाँ नाकाम रहीं क्योंकि दुहाई देनेवालोंने कभी तंत्रको समझनेमें कोई रुचि नही दिखाई।

यह मानना पडेगा कि भाषाई सॉफ्टवेअरोंका विकास कोई सरल काम नही था और भाषाई सॉफ्टवेअर बनानेवालोंके कारण ही देशमें संगणक-साक्षरता ऐसी बढी कि यूरोप-अमरीकाका काम आउटसोर्स होकर देशमें आने लगा औऱ IT industry ने अपना सुदृढ स्थान बना लिया। यह ऐसा मामला था कि जैसे कोई हमेशा झीरो अंक पानेवाला बच्चा पंद्रह अंक ले आये। खुशियाँ मनने लगीं और हम भूल गये कि कामकी जो अच्छी शुरुआत हुई उससे तो हमारी सौ अंक लानेकी क्षमता बनती थी।

स्टॅण्डर्ड लागू न करनेके तीन दूरगामी विपरीत परिणाम हुए। पहला --- दो संगणकोंके बीच आदान-प्रदान नही रहा। एकके कामसे दूसरे कई लाभान्वित होते रहें तो शीघ्रतासे तरक्की होती है। वह मौका चूक गया। दूसरा – भाषाप्रेम चाहे लाख हो, फिर भी इतना महँगा सॉफ्टवेअर खरीदना सबके लिये संभव न था, खासकर जब उसका काम दूसरे संगणकपर चल ही न सके। तीसरा – जब 1995 में ईमेल व्यवहार जनसामान्यके स्तर पर आ गया तो पता चला कि गोपनीय सोर्सकोड के कारण भारतीय भाषाकी कोई फाइल चित्ररूपमें ढाले बगैर महाजालपर (इंटरनेटपर) नही डाली जा सकती। यही कारण है कि किसी संगणक के रिजनल ऍण्ड लॅन्गवेज सेटिंगमें भारतीय भाषा नही दिखती। इस प्रकार ढुलमुल रवैयैके कारण भारतीय जनता सारी उपलब्धियोंसे वंचित रही।

भारतीय भाषाई सॉफ्टवेअर कंपनियोंकी स्पर्धा, स्वार्थके लिये समन्वयको ताकपर रखनेकी सोच और सरकारी कंपनीका भी उसी स्वार्थमें लिपटना इन तीनोंके सम्मुख बाकी देश और प्रशासन इस कदर हतबल है कि 1995 के बाद आजतक स्थितिमें कोई अंतर नही। इसी कारण यह भ्रम भी खूब फैला और बरकरार रहा कि संगणकपर काम करनेके लिये अंग्रेजी अनिवार्य है। महाराष्ट्र जैसे प्रगत और मराठी-अस्मिताकी दुहाईवाले प्रांतमें भी सरकारने कॉलेजोंमें मराठी के विरुद्ध IT का ऑप्शन मुहैया कराया, अंग्रेजी की अनिवार्यता पहली कक्षासे ही लागू हो गई और मराठीका नुकसान अरंभ हुआ जो अब भी चल रहा है।

यदि सभी कंपनियोंके सॉफ्टवेअरमें संग्रह-तंत्रका कॅरॅक्टर-कोड एकही प्रमाणकके अनुसार रखा जाता तो सामान्य व्यक्तिको लाभ होता। साथही मायक्रोसॉफ्ट जैसी कंपनियाँ जो भारतियोंकी आपसी फूट पर चटखारे ले-लेकर पलती हैं, उनपर दबाब बनाया जा सकता था कि वे इसी प्रमाणकको अपनी ऑपरेटिंग सिस्टम का हिस्सा बनायें। ऐसा कुछ भी नही हुआ। जागतिक स्तरपर भारतियोंकी छवि उभरी कि ना ही इनमें दूरगामी चिंतन है, ना एकता, ना अपनी भाषाओंके लिये अड जानेकी दृढता। एक चित्र और भी उभरा – कि भारतीय जनताके करोडों रुपयोंपर पलनेवाली सरकारी कंपनी सी-डॅक भारतीय भाषाओंके लिये कुछ नही कर रही थी बल्कि अंग्रेजी की तुलनामें उन्हे पीछे धकेल रही थी। इसका उदाहरण यह है कि तमाम भाषाओंकी एकता और प्रगति बढानेकी क्षमतावाला एक सॉफ्टवेअर बनाया लीप-ऑफिस – जिसका वर्णक्रम तो इन्स्क्रिप्ट था लेकिन उसका सोर्सकोड मानकके मुताबिक और खुला (ओपन)करनेके बजाए उसे मोनोपोलीवाला और अतीव महँगा रखा। 1993-97 के दौरान उसका एक अंश लीप-लाइट के नामसे फ्री-डाउनलोड के लिये मुहैया कराया जो केवल एक पन्नेके कामके लिये सीमित था। फिर भी उसमें इन्स्क्रिप्टकी सरलता एवं cut, copy, paste व print की सुविधाके कारण वह उपयोगी था। लेकिन 1998 में cut, copy, paste व print की सुविधा हटाकर लीपलाईटको निरर्थक बनाया और एक दूसरे सॉफ्टवेअरकी लाखों सीडी मुफ्त बाँटी जिसका फलसफा था कि आप अंग्रेजीमें लिखो और अपनी भाषामें देखो। अर्थात् मुझे अपना नाम लीना लिखने के लिये उसका अंग्रेजी हिज्जे जानना होगा और अंग्रेजी टायपिंग भी सीखनी होगी। फिर मैं लिखूँगी Leena और संगणकपटल पर लीना देखकर धन्य हो जाऊगी। मैं कई वर्षोंतक उन्हे समझाती रही कि भैये, कमसेकम पहली सुविधा तो रहने दो, वह दूसरीके आडे नही आती। पर वे नही माने। उनके साथ कई दिग्गज भी कहने लगे कि जब आप अंग्रेजीके माध्यमसे लिख सकते हैं तो अपनी लिपीका दुराग्रह क्यों? फिर 2009 में मेरे अतीव आग्रह पर वही लीपलाईटकी आंशिक सुविधा फिरसे दे दी लेकिन केवल मराठी भाषा के लिये। इसका उल्लेख न उनके होमपेजपर है, न कोई गॅरंटी कि सुविधा कबतक रहेगी और न कोई चर्चा कि यह सुविधा अन्य भाषाओंमें क्यों नही। साथही पहले इसमें जो तत्काल लिप्यंतरणकी सुविधा थी वह गायब है। पहले मेरे कई आसामी मित्रोंने ऐसा किया है कि मैं कोई संस्कृत श्लोक और उसका विवेचन हिंदीमें लिखूँ तो उसका आसामी लिप्यंतरण विद्यार्थियोंको देंगे जिससे वे संस्कृत भी सीखेंगे और हिंदी भी। मैंने स्वयं भी इसी पद्धतीसे सारी लिपियाँ भी सीखीं और कइयोंको हिंदी व मराठी सिखाई। अब वह एकात्मता और अपनापन बढानेवाला दौर समाप्त हो जायगा। यह मैं एक बडा खतरा मानती हूँ।

इस प्रकार पहले खतरेको हमने यों समझा कि यद्यपि सीडॅकने एक अच्छा सॉफ्टवेअर विकसित किया फिर भी उसे प्रमाणकके अनुरूप नही रखा और सोर्सकोड गोपनीय रखा, बाजारकी स्पर्धामें कूद पडे, अतएव उनके पास भाषाई एकात्मता सँजोनेवाला सॉफ्टवेअर होते हुए भी न वह महाजाल-व्यवहार के लिये उपयुक्त रहा और न अन्य भारतियोंकी प्रतिभाको बढावा देनेके लिये उसका कोई उपयोग हो पाया।

अब समझने चलते हैं दूसरे खतरेको
संगणककी प्रोसेसर चिपोंमें अधिक क्षमता निर्माण हुई तो उनपर आठ इकाइयोंवाली अक्षरशृंखला की जगह सोलह इकाइयोंवाली अक्षरशृंखला बनाना संभव हुआ । इससे बडी वर्णमालाओंको सम्मिलित करने के लिये कई गुना अधिक जगह बन गई। चीनी और फारसी लिपियोंके अच्छे मानक बने और उनकी भाषाएँ धडल्लेसे संगणक व महाजालपर स्थान बनाने लगीं।भारतीय भाषाओंकी एकात्मता को भी और मजबूत करने की संभावना बढ गई।

अंग्रेजीके लिये ASCII की जगह एक नया मानक युनीकोड विकसित होने लगा। साथही एक नई ऑपरेटिंग सिस्टम लीनक्स सर्वमान्य होने लगी जिसका फलसफा यह था कि संगणकसे संबंधित सभी बुनियादी और सरल सॉफ्टवेअर सबको अनिर्बंध उपल्ब्ध कराओ ताकि सबका सम्मिलित लाभ हो सके। इसी कडीमें उन्होंने एक ओर युनीकोड स्टॅण्डर्ड अपनाया तो साथमें भारतीय भाषाओंके कुंजीपटलके लिये इन्स्क्रिप्ट की-लेआउट भी। लेकिन जो जागतिक युनीकोड कन्सॉर्शियम युनीकोड मानक बना रहा था और जिसमें कुछ भारतीय भी थे, कुछ राजभाषा विभाग और सी-डॅकके अफसर भी, वहां चूक हो गई। जो मानक उन्होंने स्वीकार किया वह जागतिक होनेके कारण महाजालकी सुविधा तो आ गई और इन्स्क्रिप्ट की-लेआउट अपनानेसे टायपिंगमें सरलता भी आ गई गई पर इनके साथ एक परन्तु भी बीचमें आ गया। सोलह इकाइयोंवाली श्रृंखला के कारण जो कई गुना अधिक जगह मिल रही थी उसका उपयोग भाषाई एकात्मता बढानेके लिये करनेकी बजाए उन्होंने उस जगहका बँटवारा कर दिया और कहा कि लो अब हर भाषाको दूसरीके साथ तालमेल बनाये रखने की कोई जरूरत नही प्रत्येकका अपना अपना अलग अस्तित्व होगा। इसका परिणाम एक वाक्यमें यों है कि अब संगणकके लिये मल्याली क बंगाली क से अलग होगा। इस कारण अब शबरी पर मल्याली लिपिमें लिखी गई लोककथा भी महाजालपर होगी और बंगालीमें लिखी लोककथा भी होगी लेकिन बंगालीमें सर्चकमांड देनेपर संगणक मल्याली लोककथा को नही खोज सकेगा। इस तरह हमारी सांस्कृतिक विरासतकी एकात्मता धीरे धीरे समाप्त होती चली जायगी।

मैं यह आरोप नही लगा रही कि इन बातोंके पीछे कोई सोची समझी चाल है। लेकिन मेरा यह मानना है कि हमारे अंदर एक किस्मकी लापरवाही है और अदूरदर्शिताभी। यही जागतिक युनीकोड कन्सॉर्शियम है कि जब उसने चीनी-जपानी-कोरियाई लिपियोंकी एकात्मता बरकरार रखनेके प्रयास नही किये तो उन देशोंने अपने राजकीय मतभेद और स्पर्धा भुलाकर आपसी समझौतेसे एक मानक बनाया और युनीकोड कन्सॉर्शियमको खबरदार किया कि तुम्हे यही मानक अपनाना होगा जो हमने अपने लिया चुना है। यही तेवर और ललक यदि भारतीयोंने नही दिखाई है तो इसका एक ही अर्थ है कि हम कभी अपनी एकात्मताके प्रति सजग और अभिमानी थे ही नही। और आज उसे बिखेरनेमें सहायक बने रहेंगे।
क्या अब भी हम सजग नही होंगे ?

========================================================================