युनिकोड देवनागरी – किती कमावले, किती गमावले.

Submitted by किरण on 10 June, 2010 - 14:59

(विशेष सूचनाः खालील लेखात जिथे जिथे युनिकोड असा उल्लेख आहे तिथे संदर्भाप्रमाणे युनिकोड आधारित सध्याच्या सर्व उपप्रणाल्या अंतर्भूत आहेत. फक्त युनिकोड कंझॉर्टियम नव्हे. ह्या उपप्रणाल्या म्हणजे Input Method Editor (IME)/Keyboard, Unicode encoding, serialization, storage, retrieval systems, operating systems, rendering engine, support for Complex scripting, fonts, uniscribe or equivalent for character sequencing, display systems and end user applications)

एकीकडे युनिकोडमुळेच मराठी संगणकयुगात वावरु शकते ह्याचा अभिमान असताना युनिकोड देवनागरीच्या प्रमाणीकरण करताना झालेल्या घोडचुकांमुळे मराठी लिपी (देवनागरी) चे सौंदर्य, वैशिष्ट्ये व विविधता ह्या सर्वांना धोका निर्माण झाला आहे.

हे गौडबंगाल अनेक तंत्रज्ञांना अजून कळले नाहीये तर सामान्य जणांना विचारतोच कोण!

हा विषय खूपच व्यापक आणि क्लिष्ट आहे आणि त्यामुळे बरेच लोक ते समजून घ्यायच्या भानगडीत सुद्धा पडत नाहीत.. शिवाय ह्यातील सर्वसमावेशक असे विवेचन लिहायला गेल्यास एक ग्रंथ लिहीता येइल.

बऱ्याच लोकांना हा लेख कशासाठी लिहीला आहे असाही प्रश्न पडण्याची शक्यता आहे. पण इथे येणारे बरेच लोक हे संगणक कुटण्याची कामे करतात त्यामुळे लोकांची ह्याबाबत नेमकी मते काय आहेत, तसेच ज्यांना ह्याबद्दल उत्सुकता आहे पण जाणून घ्यायला जमले नाही त्यांना थोडेफार आकलन व्हावे मग किती जणांना हा खरोखर प्रॉब्लेम वाटतो का? व वाटलाच तर तो कसा सोडवता येइल ह्याबाबत मला जाणून घ्यायचे आहे.

हा विषय इथे शास्त्रशुद्ध पद्धतीने मांडावा असे बरेच दिवस मनात होते, पण वेळेअभावी व येथे रोजच येणे शक्य नसल्याने पुढे ढकलत होतो. युनिकोडला १७ वर्षे आणि युनिकोड देवनागरी येउन १३ वर्षे लोटूनसुद्धा (माझ्या !) मनायोग्य असे प्रमाणीकरण झालेले नाही व नजीकच्या भविष्यात तसे होण्याची चिह्नेही दिसत नाहीत.. केवळ काही अक्षरांना क्रमांक दिले म्हणजे प्रमाणीकरण असे ज्यांचे म्हणणे असेल तर ते झालेले आहे पण निर्दोष वापरण्याच्या दृष्टीने त्याचा उपयोग मर्यादितच राहिला आहे. ह्यामध्ये इतर प्रणाल्यांवर जी जबाबदारी सोपविण्यात आली आहे त्यामुळे हा प्रश्न व त्याची उत्तरे खूपच गुंतागुंतीची झाली आहेत.

सर्वसामान्य माणसाच्या अपेक्षा फारच थोड्या – म्हणजे मराठीत दिसणे, अचूकपणे लिहीता येणे, इमेल पाठवता येणे व पलीकडील संगणकावर ‘तसेच्या तसे’ दिसणे – इतक्या माफक असून त्यादेखील अजून पूर्णपणे साध्य झालेल्या नाहीत. (इथे प्रौढी मिरवायचा हेतू नव्हे, पण ज्या १० वर्षांपूर्वीच किरण फॉण्टने सोप्या पद्धतीने करुन दाखवल्या होत्या)

वास्तविक पहाता प्रमाणीकरणाकडून ह्यापेक्षा खूप जास्त अपेक्षा आहेत

प्रमाणीकरणाकडून अपेक्षा व युनिकोडने पूर्ण न होउ शकलेल्या सध्याच्या समस्या

१. टाइप करण्यासाठी सोपी, एकसमान व प्रमाणित पद्धत. ह्यातील प्रत्येक गरज अत्यंत महत्वाची आहे.

a. जवळजवळ प्रत्येक मराठी साईटवर युनिकोड टाईप करण्यासाठी वेगवेगळया पद्धती आहेत.

b. शिवाय Online / Offline IME, Keyboard Overlays, Transliterators programs (‘मिन्गलिश’ मध्ये लिहिलेले देवनागरीत बदलणारे) असे असंख्य प्रकार आहेत.

c. मुख्य म्हणजे ह्यातल्या एकाही पद्धतीत सर्वच्या सर्व मराठी भाषेतील देवनागरी अक्षरे जशी यायला हवीत तशी लिहीता येतीलच असे ठामपणे म्हणता येत नाही. ह्यातील काही कारणे त्या पद्धतीत असली तरी काही कारणे युनिकोडच्या सदोष एनकोडींगवर तर काही विविक्षीत फॉण्ट तर काही Operating Systems वर आधारित आहेत.

d. Minglish आधारित पद्धत मला तत्वतः अजिबात मान्य नाही. जरी त्यात कामचलाऊ मराठी लिहीता येत असले तरी बोजड संस्कृत मधील श्लोक लिहायला गेल्यास अवघड जागेचे दुखणे होऊन बसते!

२. सर्व आघाडीच्या संगणक प्रणाली (ऑपरेटींग सिस्टमस्) मध्ये मान्यता. (विंडोज, लिनक्स, मॅक)

a. युनिकोडमध्ये टाईप केलेला मजकूर सर्व प्रणालीत जसाच्या तसा दिसत नाही. अर्धा र Apple मधल्या A च्या उच्चाराचे मराठी अक्षर, सर्व काना, मात्रा, विशेषतः र् हस्व वेलांटी ह्यात अनेक दृष्टीआड करता न येण्यासारख्या त्रूटी आहेत.

३. सर्व संगणक कार्यक्रमात (प्रोग्रॅम्स) समान आचरण – मजकुराची प्रत एका कार्यक्रमातून दुसरीकडे नेल्यास अक्षरांची फेरफार न होणे.

a. उदा. Microsoft Word मध्ये युनिकोडमधला केवळ ‘काना’ टाइप करता येत नाही. त्याअगोदर एखादे अक्षर असणे आवश्यक असते. मात्र हीच गोष्ट नोटपॅडमधे शक्य आहे! तसेच Word मधेच Insert Symbol वापरुन थेट युनिकोड Enter केल्यास ते करता येते. असे का? ह्याचे उत्तर मला तरी मिळालेले नाही.

b. अनेक प्रोग्रॅम्स अजूनही युनिकोड पूर्णपणे सपोर्ट करत नाहीत. अनेक प्रोग्रॅम्स एकतर Unexpected character strings मुळे क्रॅश होतात अथवा अपेक्षेप्रमाणे चालत नाहीत. (ह्यामध्ये ऱ्हस्व वेलांटी अक्षराच्या नंतर दिसणे, अर्धा र बरोबर न दिसणे, जोडाक्षरे व्यवस्थित न दिसणे, ? किंवा चौकोन दिसणे इ प्रकार अंतर्भूत आहेत). अनेक Photo Editor, Image Processing, Animation, Desk Top Publishing चे प्रोग्रॅम्स ह्यात अंतर्भूत आहेत.

४. मराठीतील सर्व मुळाक्षरे व जोडाक्षरे त्यातील लिपीच्या संकेतानुसार लिहीता येणे

a. ह्यात अर्धा र, पहिली वेलांटी, अ अधिक काना म्हणजेच आ, क्ष व ज्ञ ह्यांना (विशेष संयुक्त) मुळाक्षरे म्हणून मान्यता, व्यंजनांच्या अर्धस्वरुपाला व प्रचलित जोडाक्षरांना प्रमाणित स्थान, इ मुद्दे येतात.

५. संगणकाच्या पद्धतीने क्रमित (सॉर्ट) केल्यास वर्णमालेच्या क्रमाने लावता येणे

a. देवनागरी ही लिपी अनेक भाषांसाठी वापरली जात असल्याने आणि प्रत्येक भाषेचा वर्णानुक्रम थोडाफार वेगळा असल्याने हा गोंधळ निर्माण झाला असला तरी सध्याचा युनिकोड मधला क्रम ही कुठल्याच भाषेतील वर्णमाला नाहीए.

b. क्ष ने सुरु होणारे शब्द क व ख च्या मध्ये येतात तर ज्ञ ने सुरु होणारे शब्द चक्क ज व झ च्या मधे येतात! युनिकोड देवनागरी तक्ता ह्या दोन्ही अक्षरांना जोडाक्षरे मानतो.

c. ह्याशिवाय इतर अनेक अक्षरे युनिकोडच्या अनुक्रमात अक्षरशः घुसडलेली आहेत जी देवनागरीत कधीही अस्तित्वात नव्हती (उदा. ऒ ऍ ऎ ॊ ॆ). ह्याला इतर भारतीय भाषांशी अनुरुपता असे नाव दिले आहे, मात्र वास्तवात ती शोभेचीच ठरावीत. वास्तविक हे ISCII ने केलेले Work Around होते मात्र ते युनिकोड मधे तसेच अकारण आले आहे.

६. लिपीची वैविध्यता व शैली लक्षात घेऊन लिहीण्याचे स्वातंत्र्य एकाच टंकात (फॉण्ट) लेखकास बहाल करणे जेणेकरुन लेखक त्याच्या पसंतीनुसार निवड करु शकेल

a. आपली लिपी प्रत्येकाला अनेक पर्याय बहाल करते. उदा. अश्व हा शब्द आपण अ, श् व असाही लिहू शकतो. मात्र युनिकोड मध्ये ते जोडाक्षर कसे दिसावे हे फॉण्ट मधले टेबल व रेंडरींग ईंजिन ठरवत असल्याने लेखकाला ती निवड करता येत नाही. सर्व जोडाक्षरांसाठी हाच नियम लागू होतो.

७. मुख्य म्हणजे देवनागरी ही बोलीभाषा नसून लिपी असल्याने निर्माण केलेले प्रमाण छपाई व प्रदर्शन (डिस्प्ले) ह्यांना सर्वप्रथम प्राधान्य देऊन केलेले असावे.

a. मुळातच लिहीण्याच्या शैलीवर कोणताही प्रतिबंध मला स्वतःला अमान्य आहे. Roman अक्षरे लिहीताना जर एखादे चुकीचे स्पेलींग लिहीले तर कोणताही एडीटर त्यास अटकाव करत नाही. स्पेल चेकर त्यातील चूक दाखवून देऊ शकतो, पण ती मान्य / अमान्य करणे लेखकाच्या हातात ®®असते. मात्र युनिकोड देवनागरीसाठी ह्याचे स्वातंत्र्य नाही.

b. म्हणजेच जर मला मुद्दाम होउन अ ला २ काने द्यायचे असतील तर ते युनिकोड आधारित सध्याच्या प्रणालीमध्ये ते शक्य नाही.

c. ह्या उणीवेमुळे, देवनागरीच्या उपयोगावर निष्कारण प्रतिबंध येतो. उदाहरणार्थ, संगीतातली नोटेशन्स लिहायला देवनागरीत एक विशीष्ट पद्धत वापरतात (भातखंडे लिपी?). ती युनिकोडमध्ये लिहीता येत नाही.

८. टंकीत केलेला मजकूर कोणालाही कुठल्याही प्रणालीवर संपादित करुन इतर भागास धक्का न पोचता पाठवता यावा.

a. आधी सांगितल्याप्रमाणे युनिकोड देवनागरीमधल्या मजकूरातील काही अक्षरे किंवा जोडाक्षरे विविध प्रणालींवरती वेगवेगळा दिसतो त्यामुळे एका पणालीमध्ये केलेली दुरुस्ती पुन्हा दुसऱ्या प्रणालीत चुकीची दिसते

ह्याचा एकत्रित परीणाम हा झाला आहे की ज्यांना शुद्ध मराठी येते त्यांनादेखील एखादे अक्षर संगणकावर कसे लिहावे ते माहित नसल्याने अशुद्ध लिहीले जाते आणि अनेक संकेतस्थळांवर असे अशुद्ध मराठी कायमस्वरुपी जतन केले जात आहे.

अर्थात मग युनिकोड एकदमच टाकाऊ आहे का? तर नाही. युनिकोडमुळे देवनागरीला non-sharable असे स्थान मिळाले आहे. Microsoft, Apple, Google, Adobe अशा बड्या धेंडांच्या Sub-system Implementation सपोर्ट मिळाल्यामुळे आजच्या काही ब्रोऊजर्स मध्ये तरी देवनागरी दिसू शकते. इमेल वेगवेगळ्या सर्व्हर्समधून जात असल्याने आणि त्यातल्या एकाही दुव्यात युनिकोड Encoding Compatibility नसेल तर पलिकडील संगणकावर बरोबर दिसेल ह्याची खात्री देता येत नाही. पण याहू, जीमेल अशा वेब बेस्ड सिसटीम्स मधे बऱ्यापैकी कम्पॅटिबिलिटी आहे.

सर्वसाधारणपणे असे म्हणता येइल की वेब बेस्ड सिस्टीम्स ह्या बऱ्यापैकी अद्ययावत असल्याने त्यांनी युनिकोड अनुरुपतेत बऱ्यापैकी बाजी मारली आहे. मात्र अशी Softwares ज्यांना Internationalization करुन कोणताच जास्त आर्थिक फायदा नाही त्यांनी युनिकोडशी अनुरुपता करण्याचे टाळले आहे किंवा तो त्यांचा प्राधान्यक्रम नाही. एखादा प्रोग्रॅम युनिकोड अनुरुप करणे ही साधीसुधी गोष्ट नाहीए, त्यासाठी आमूलाग्र बदल आवश्यक असतो, इतका की कधी कधी त्यापेक्षा तो पुनर्निर्मित करणे सोपे पडावे. ह्याविषयी पुन्हा केव्हातरी.

पण हेही एक कारण आहे की ज्यामुळे सर्व प्रोग्रॅम्स आजही युनिकोडशी अनुरुप नाहीत आणि ते होण्याची शक्यताही नाही. असो.

काही महत्वाच्या पोष्ट्स व त्याची उत्तरे

किरण | 12 June, 2010 - 21:26

सर्वांच्या प्रतिसादासाठी पुन्हा एकदा धन्यवाद. तसेच सर्वांना वेळेअभावी उत्तर देता येत नसले तरी जमेल तसे वाचत आहे. त्यामुळे एखाद्या प्रश्नाला उत्तर द्यायचे राहून गेले असेल तर मला विपूत लिहावे. जसे जमेल तसे मी लिहीन. कोणाचाही अनुल्लेख करायचा हेतू नाही आणि कोणतीही शंका अयोग्य नाही.

गजाननः तुमचे प्रश्नही योग्य आहेत. आणि त्यात बाळबोध असे काहीही नाहीत. मलादेखील कधीना कधी ते पडलेच होते आणि अजूनही सर्वांची योग्य उत्तरे माहित आहेतच असेही नाही. किम्बहुना मी अनेकांशी बोलूनदेखील बर्‍याच जणांना अनेक महत्वाच्या गोष्टींची सुद्धा माहितीच नसल्याचे जाणवले.

मी माझ्या मतिप्रमाणे त्याची उत्तरे द्यायचा प्रयत्न करतो.

> फॉण्ट निर्मितीची प्रक्रिया नेमकी काय असते?
उ. फॉण्ट निर्मितीची थोडक्यात प्रक्रिया अशी: (मात्र त्यात युनिकोड आधारित फॉण्ट बनवणे ह्यात अनेक क्लिष्ट गोष्टी आहेत त्याबद्दल मी नन्तर लिहीन. )
फॉण्ट वापरुन आपल्याला जी अक्षरेदिसायला हवीत त्यांचे डिझाईन कागदावर मोठ्या आकारात तयार करणे.
ती स्कॅन करुन विशीष्ट टूल्स वापरून त्यांचे vectorization करणे. देवनागरी फॉण्ट्ससाठी शिरोरेखेचे भान ठेवणे अतिशय आवश्यक असते कारण ती सलग, सारख्या जाडीची आणि एकाच उंचीची दिसणे अतिशय महत्वाचे असते. ही फाईन अ‍ॅड्ज्स्ट्मेण्ट प्रत्येक अक्षरासाठी मॅन्युअली करावी लागते. तसेच प्रत्येक फॉण्ट साईजला सर्व अक्षरे बरोबर दिसतात की नाही, ई अनेक गोष्टी पहाव्या लागतात. नन्तर विवक्षीत टूल्स वापरुन मानकाप्रमाणे अक्षरे योग्य सांकेतांकाना जोडून घेणे. ही ASCII व True Type Font बनवण्याची पद्धत झाली.

मात्र युनिकोड देवनागरीसाठी Open Type Font वापरावा लागतो आणि त्यात अतिशय क्लिष्ट असे Rules scripting करावे लागते. त्याच्या तपशीलात मी सध्या शिरत नाहीये.

> एखाद्या लिपीला युनिकोडमध्ये स्थान मिळवण्यासाठी काय करावे लागते?
उ. युनिकोड कंझॉर्टियम ही एक स्वायत्त संस्था आहे. http://www.unicode.org ह्या दुव्यावर अधिक माहिती मिळु शकेल.
मात्र ह्यात स्थान मिळवण्यासाठी काय करावे लागते त्याचा तपशील मला माहित नाही.

> त्यात पुन्हा बदल करायचे असतील तर काय करावे लागते? बदलाला कोणाची मान्यता असायला लागते. यात मदत करायची इच्छा असल्यास कोणाच्या संपर्कात राहिले पाहिजे?
उ. युनिकोडच्या स्थापना झाल्यावर त्याच्या प्रमोटर्सनी जगातील सर्व writing systems चा सर्वे घेउन काही भाषा निश्चित केल्या तसेच जरी ही नॉन प्रॉफिट ऑर्गनायझेशन असली तरी त्यावर त्याच्या promoters चा खूप प्रभाव आहे. त्यामूळे जरी एखादा बदल सजेस्ट केला तरी तो अमलात यावा अथवा नाही ह्यावरती अंतिम निर्णय जरी त्यांना भाषेबाबत काहीही माहिती नसली तरी तेच घेऊ शकतात. आणि ह्यामुळेच साध्या साध्या गोष्टींसाठी सुद्धा (मराठीतला अर्धा र, बंगालीमधला खण्ड त) खूप पाठपुरावा करावा लागतो असे ऐकून आहे. शिवाय ह्यात कालापव्यय झाल्याने तोपर्यंत इतर प्रणाल्यांमधे त्रुटी राहून जातात आणि नन्तर जरी त्यात बदल झालाच तरी इतर प्रणाल्यांवर जी जबाबदारी सोपविली आहे त्याचे निर्माते वेगवेगळे असल्याने तसेच त्यांना हे बदल अमलात आणायचे कुठलेच बंधन नसल्याने हे बदल आपल्यापर्यंत पोचण्यास अनेक वर्षे जातात. युनिकोड्चे आत्तचे version 5.2 आहे. जवळ जवळ सर्व मेजर व्हर्जन मध्ये देवनागरी अक्षरे त्यात टाकली गेली मात्र युनिकोड आधारित फॉण्ट मधे त्याची अंमल्बजावणी त्या त्वरेने होऊ शकत नाही.

एकाच लिपीचे वेगवेगळे फॉण्ट युनिकोडमध्ये असू शकतात का? (वर तुम्ही ६४००० गुणिले १७ असा हिशेब दिला आहे. म्हणजे प्रत्येक लिपीच्या / भाषेच्या वाट्याला मर्यादित युनिकोड येत असतील ना?)

उ. हो. आणि ते असायलाच हवेत, तरच काहीतरी उपयोगी गोष्ट घडू शकते. मात्र देवनागरी युनिकोड फॉण्ट कसे बनवावेत ह्याबाबत अतिशय कमी माहिती सध्या उपलब्ध आहे. जी आहे ती मी समजून घ्यायचा प्रयत्न केला पण ती जणू काही कोणाला समजू नये अशाच प्रकारे लिहीली असावी असे वाटावे असा संशय यावा अशी परिस्थीती आहे. अर्थात हे माझे स्वतःचे मत आहे. मात्र एक गोष्ट निश्चित की एक युनिकोड देवनागरी फॉण्ट बनवण्यासाठी लागणारे परिश्रम एका माणसाच्या आवाक्याबाहेर आहेत.

इतरांना ह्याबद्दल आणखी माहिती असेल तर कृपया द्यावी.

* संपादन
* प्रतिसाद

किरण | 13 June, 2010 - 00:27

अजय, हा तुझ्या काही इतर मुद्द्यांवरचा रीप्लायः
ज्या मुद्द्यांवरती तुझा रिप्लाय युनिकोडच्या आवाक्याबाहेर आहेत असा आहे, ते मलासुद्धा मान्य आहे, मात्र भारतीय - देवनागरी - मराठी - end user ह्या नात्याने उपलब्ध सोल्यूशन ने अनेक प्रश्न निर्माण केले आहेत.
त्याबद्दल हे सर्व.

>>>
१. तुझे मुद्दे बरोबर असले तरी युनिकोडच्या संदर्भात पटत नाही. मुळात Ascii पद्धत का सुरु झाली? तर वेगवेगळ्या Operating system मधे असलेला Data सहज एका संगणकावरून दुसरीकडे नेता यावा म्हणून. यात डाटा Input कसा करावा हे कुठेच लिहिलेले नाही. उदा. QWERTY पद्धतीची एकच input method असूनही Ascii आणि EBCDIC अशा दोन अंतर्गत पद्धती होत्याच की. त्यामुळे Unicode, फक्त एकदाच Unicode मधे असलेला Data कुठल्याही संगणकावर सारखा कसा वापरता येईल यासाठी तयार केली गेली आहे. IME चे प्रमाणिकी करण आवश्यक हा तुझा मुद्दा योग्य असला तरी युनि़कोडच्या आवाक्याबाहेरचा तो मुद्दा आहे.

रिप्लाय:
EBCDIC ह्या पद्धतीतही असेच अनेक दोष होते जसे की A साठी चा Code + 1, असे केल्यावर B चा कोड यावा इतके साधे logic सुद्धा त्यात नव्हते. म्हणजेच A to Z ला Continous Code Assignment नव्हती, त्यामुळे programmers च्या डोक्याला इतका अनावश्यक त्रास झाला की ती सिस्टीमच रद्दबातल झाली आणि ASCII अस्तित्वात आली.

"Information Interchange" इतके सिमीत objective जरी आपण युनिकोड च्या बाबतीत ठेवले तरी त्या त्या लिपीतील सर्व प्रमाणभूत अक्षरांना प्रमाणित स्थान मिळाले नसल्याने (अर्थात हे माझे मत आणि ह्याबाबत अनेक मतमतांतरे असू शकतात आणि ह्यासंदर्भात पलिकडूल बाजूचे काही मुद्दे देखील मला मान्य आहेत). उदाहरण द्यायचे झाले तर समजा आपण इन्ग्लिश करता प्रमाणीकरण करत आहोत आणि समजा त्यात X, Y, Z ही अक्षरेच घेतली नाहीत. आणि ती न घेतल्यामुळे होणारा घोळ थांबवण्यासाठी असे वर्क अराऊंड काढले की X म्हणजेच A*, Y म्हणजेच B*, Z म्हणजेच C*. अशा प्रकरचे घोळ युनिकोड मध्ये झाले आहेत. शिवाय नंतर पाठपुराव्यामुळे X, Y, Z त्यात घातले गेल्यावर होणारे घोळ तर अवर्णनीय आहेत.
त्यामुळे Backward Compatibility च्या नावाखाली वर्क अराऊंड ही व्हॅलीड ठरते आणि नवीन कोड सुद्धा!
आज अर्धा र लिहायच्या २ पद्धती अस्तित्वात आहेत

१. नुक्ता वाला र, पाय मोडायचे चिह्न
२. नेहमीचा र, पाय मोडायचे चिह्न, ZWJ (Zero Width Joiner)

शिवाय युनिकोड हे म्हणायला मोकळे आहेच की आम्ही थोडेच सांगितले होते की आमच्या वर आधारित सिस्टीम बनवा! आणि ते खरेच आहे. हे आपल्यालाच ठरवायचे आहे की आपण आहेत त्या त्रूटींसकट केवळ ते एकमेव मानक अस्तित्वात आहे म्हणून तसेच चालवून घ्यायचे की एखादे नवीन Open Source Standard वापरायचे?

>>>२ a. हा युनिकोडचा दोष नाही. युनिकोडच्या एका जुन्या आवृत्तीत अर्धा र (र्‍) नव्हता. TDIL ने त्याबद्दल पाठपुरावा करून तो नवीन आवृत्तीत आणला (२००४ मधे). त्याबद्दलची चर्चा अजूनही जालावर उपलब्ध आहे ( http://unicode.org/~emuller/iwg/p8/index.html) पण ती सुधारण झाल्यावर काही फाँट निर्मात्यांनी योग्य तो बदल केला काहीनी केला नाही हा युनिकोडचा दोष नाही. आजही W3 ने ठरवलेली सर्व प्रमाणे काही Browsers नीट अंमलात आणत नाही (उदा. IE 6 ) हा CSS किंवा HTML या प्रमाणांचा तो दोष नाही Microsoft सारखी कंपनी नीट अंमलात आणत नाही हा दोष आहे.

रिप्लाय:
हो पण users नी बोम्बाबोम्ब केली की लगेच ते त्यात सुधारणा करतात कारण त्याचा Direct Commercial Impact असतो. युनिकोड मराठी देवनागरी साठी जो user group आहे, त्याने ह्या कंपन्यांवर negligible commercial impact आहे. त्यामुळे जरी कोणी हे आक्षेप घेतले तरी त्याला शून्य priority मिळते. मूळात हा मोठा घोळ आहे हे समजण्यात आणि मान्य करण्यातच जिथे एकमत नाही तिथे सुधारणा होण्याची अपेक्षा करणेच चूक आहे.

>>>
तुला डाटाबेसची माहिती असेल तर हा क्ष आणि ज्ञ मधेच Sort होणे हा मुद्दा अनेक अभारतीय भाषांनाही आहे. त्यासाठी युनिकोडवर आधारित पण भाषेसाठी वेगळे collation sequences उपलब्ध आहेत. ते वापरले तर हा प्रश्न नाही.

रिप्लाय:
माझा मुद्दा हाच आहे की ASCII System मधे Roman Letters ना योग्य assignment केल्याने कोणतेही additional logic न लिहीता ती अक्षरे व्यवस्थित sort होतात. युनिकोडमधली अक्षरे Excel मधे Sort करुन पहा.

>>>६. लेखी लिहतांना स्वातंत्र्य असले तरी प्रत्यक्षात त्या स्वातंत्र्याचा किती उपयोग होतो हा विचार करणेही आवश्यक आहे. मांदारीन आणि कँटोनिज या भाषा संगणकावर आणताना अशा अनेक तडजोडी केल्या गेल्या. त्यामुळे भाषा तशीच्या तशी संगणकावर यायलाच हवी असे नाही.

रिप्लाय:
हे अजिबात मान्य नाही. भाषा ही त्यांच्या लिपीच्या संकेताप्रमाणे आणि योग्य रितीने यायलाच हवी. नाहीतर मिन्लिश काय वाईट? आपल्या मुलांना शिकवताना जर आपल्याला असे शिकवावे लागत असेल की 'मराठी' लिहायला 'maraaThI' टाईप कर तर आज इन्ग्रजी माध्यमात शिकणार्‍या मुलांना 'मराठी' हे 'maraaThI' असेच वाचायला देखील सोपे वाटते.

>७. अ पटले नाही. कुठला शब्द योग्य आहे का नाही हे दाखवणे त्या त्या Spellchecker वर अवलंबून आहे युनीकोडशी नाही. अगदी इंग्रजीतही color आणि colour हे चूक का बरोबर कुठला Spellchecker यावर अवलंबून आहे.

रिप्लाय:
नक्की काय पटले नाही ते कळले नाही. माझाही तोच मुद्दा आहे की स्पेलचेकर असताना अनावश्यक बन्धने कशाला?

>७. c. अजिबात पटले नाही. भातखंडे पद्धत देवनागरीशी जुळती असली तरी मुळात ती वेगळी लिपी/भाषा आहे. मी उद्या माझे संगीताचे नोटेशन काढले कि ज्यात सी शार्प ( C#) असा न लिहिता C च्या डोक्यावर शार्प असेल अशी खूण लिहायची. मला ती कागदावर लिहिता आली पण संगणकावर लिहिता आली नाही तर तो ASCII या प्रणालीचा दोष नाही.

रिप्लाय:
अजय, तुझ्या उदाहरणाप्रमाणे असेल तर मलाही मान्य आहे, मात्र ईथे तसे नाहीये. इथे असे आहे की मला C# सुद्धा लिहीता येणार नाही कारण तो valid english word नाही. भातखंडे लिपीत (चु. भु. घ्या. द्या.) मंद्र्सप्तकातील सा लिहीताना प्रत्येक स्वराखाली पाय मोडण्याचे चिह्न असते. जसे ग् . अर्थातच मन्गल फॉण्ट मधे सा चा पाय मोडण्याची सोय नाही. पुन्हा हा युनिकोड चा दोष नाही हे ऐकण्याची ईच्छा नाही, ते माहित आहेच. मात्र ह्यावर ज्या फॉण्ट मधे अशी सोय असेल असा फॉण्ट करा आणि वापरा असे उत्तर असेल (Technically only that solution is possible) आणि जरी ते केले तर एकच मजकूर वेगवेग्ळ्या फॉण्ट मधे वेगळा दिसणे हा अतिशय धोकादायक प्रकार सुरु होईल.

>>>८. पुन्हा एकदा: युनिकोडमधे एकदा असलेला मजकूर कुठल्याही प्रोग्रामला सारखाच दिसतो. तो आत टाकायची पद्धत (IME) आणि दृष्य पद्धत (Rendering) यात ज्या तृटी आहेत त्यामुळे मूळ प्रमाण चुकीचे होत नाही.

रिप्लाय:
ह्याच्यामुळे प्रमाण चु़कीचे होत नाही हे मान्य पण प्रमाणकात सुद्धा वर दाखवलेल्या त्रुटी आहेतच.

>>> कुठले अक्षर दुसर्‍या अक्षराच्या जवळ आल्यावर कसे दिसावे हे Unicode सांगत नाही ते काम एकतर Script engine करते किंवा त्याचे नियम त्या फाँट्मधेच असतात.

रिप्लाय:
नेमका हाच तर प्रोब्लेम आहे. प्रत्येक घटकाने हेच म्हटले की माझे काम मी उत्तम प्रकारे केले आहे आता पुढच्याने ते बरोबर नेले नाही त्याला मी जबाबदार नाही ते तुमचे तुम्ही बघा!

हे म्हणजे असे झाले की माझ्याकडे १kg चे 'प्रमाणित' वजन आहे पण ते फक्त माझ्याकडच्या तराजूत मोजले तरच. तुमच्या कडच्या तराजूत मोजले तर १kg तर नाहीच येणार पण किती येईल ते मी सांगू शकत नाही स्मित

>अनेक संकेतस्थळांवर असे अशुद्ध मराठी कायमस्वरुपी जतन केले जात आहे.
हे मला पटले नाही. पण घटकाभर असे धरून चालू की ते खरे आहे. पण प्रत्येक फाँट तयार करणारा त्याला वाटेल तशी प्रणाली करत होता तेंव्हा जो गोंधळ होता त्यापेक्षा ही सुधारणा आहे हे तुला पटतंय का?

रिप्लाय:
ही सुधारणा असावी अशी माझी मनापासून आणि कळकळीची अपेक्षा आहे पण माझ्या मतानुसार रोगापेक्षा इलाज भयंकर असे हे आहे. अर्थात मला जितके हे प्रखरतेने वाटते तितके सगळ्यांना वाटणारच असे नाही. ते प्रत्येकाच्या भाषेच्या आणि लिपीच्या प्रेमावरती अवलम्बून आहे. मी त्याचा जेवढा अधिक अभ्यास करतोय तितकेच ते मला अधिक प्रकर्षाने जाणवत रहातेय.

मी तर असे म्हणेन की अगदी कुठल्याही पुर्वीच्या देवनागरी फॉण्ट मधल्या सर्व अक्षरांना जरी युनिकोड मधे स्थान मिळाले असते तरी बर्‍याच प्रमाणात घोळ कमी झाला असता. मात्र सध्याचे नम्बरींग उच्चाराधिष्टीत केले गेले आहे आणि त्यातही सुसूत्रता नाही बाकी सर्व बाबी फॉण्ट, रेण्डरींग ईंजिन, ऑप्रेटींग सिस्टीम आणि अ‍ॅप्लिकेशन ह्यावर सोडलेल्या आहेत.

एकाच फॉण्ट्मधला (उदा. मंगल) मजकूर एकाच ऑपरेटिंग सिस्टीम (विंडोज) मध्ये वेगळ्या अ‍ॅप्लिकेशन्स मध्ये वेगळा दिसतो ह्या गोन्धळाला काय म्हणावे? आणि मी युनिकोड सपोर्टेड अ‍ॅप्लिकेशन्स म्हणत आहे. अनसपोर्टेड अ‍ॅप्लिकेशन्स नव्हेत. ह्यात केवळ underlying character code sequence same आहे ह्यावर मी तरी समाधानी राहू शकत नाही. पुर्वीच्या फॉण्ट्मध्ये निदान एकदा लिहीलेला मजकूर दुसरीकडे पेस्ट केला तर तो फॉण्ट इन्स्टॉल्ड असेल तर १००% नक्की तसाच दिसणार ही खात्री होती. आता तसे नाही.

शिवाय मी म्हटल्याप्रमाणे हे लिपी चे प्रमाणीकरण आहे भाषांचे नव्हे. त्यामुळे लिखीत खूणांचे प्रमाणीकरण आवश्यक आहे, उच्चाराप्रमाणे नव्हे. लिखीत खूणा उच्चाराप्रमाणे असणे हे आपल्या भाषांचे वैशिष्ट्य आहे मात्र ते १००% बरोबर नाहीए आणि नेमके हेच गृहितक युनिकोड चे नंबरींग करताना धरले गेले जे असे असायला नको होते.

वास्तविक देवनागरी लिपी ही इतकी Scientific आहे हे मला त्यावर अधिकाधिक माहिती घेतल्यावर कळत जात आहे.

अजय, वेगवेगळ्या फॉण्ट्सचा वापर ह्याने थांबला असता तर नक्कीच ते आवडले असते. पण तेही उद्दिष्ट साध्य होत नाहीये. आजही प्रिंट मिडीया, पब्लिशींग हाऊस, Visual and Creative signs येथे अजूनही वेगवेगळ्या प्रणाल्या चालूच आहेत कारण त्यांना हे मनमानी रुल्स परवडणारे नाहीत.

वेबवरचा उपयोग हा मी कॅज्युअल मानतो (माहितीची देवाण घेवाण म्हणजे तो महत्वाचा नाहीए असे नाही पण तो एकच उपयोग नाहीए) आणि सध्यातरी तेवढ्याच उपयोगापुरता युनिकोड चा उपयोग मर्यादित राहिला आहे. अगदी गूगल सर्च करण्यासाठी सुद्धा ह्यात अनेक त्रुटी आहेत. कारण एका शब्दाचे एकच स्पेलिंग असावे हेदेखील होऊ शकलेले नाहीये.

शासनाच्या कारभाराकरता युनिकोडचा वापर करावा हा अध्यादेश सुद्धा नॉन युनिकोड प्रणाल्यात टाईप करावा लागतो ह्यापेक्षा मोठा विनोद काय असेल?

>>> मुळात युनिकोड आधारीत सगळ्या प्रणाली याच एका लेखात अंतर्भूत करणे हे योग्य नाही असे माझे प्रामाणिक मत आहे. उदा. माझ्या मोबाईलवर एक जर्मन साईट नीट दिसत नाही म्हणजे सगळे HTML, CSS, Fonts, मोबाईलची OS, mobile browser सगळे अंतर्भूत करून HTML योग्य नाही म्हणण्यासारखे आहे.

रिप्लाय:
नाही. उलट असा समग्र विचारच करणे आवश्यक आहे. माझ्या मनात ह्याबद्दलच्या सोल्यूशनचा आराखडा तयार ही होत आहे मात्र त्यात अनेक तज्ञांचा सहभाग आवश्यक आहे.

विषय: 
Group content visibility: 
Public - accessible to all site users

वेबमास्तर/अ‍ॅड्मीन साहेब! बर्‍याच वर्षानी इकडे फिरकलो धूळ झटकायला Happy इथली चित्रे (इमेजेस) कुणीतरी काढून नेली आहेत बुवा Happy शक्य असल्यास backup मधुन recover करावी ही विनन्ती.
तसेच देवनागरी लिपीचा अपभ्रंश ह्या लेखातील इमेजेस ही गायब आहेत. त्यातील इमेजेस http://unidevmarathi.blogspot.com येथे मिळतील.

Pages