युनिकोड देवनागरी – किती कमावले, किती गमावले.

Submitted by किरण on 10 June, 2010 - 14:59

(विशेष सूचनाः खालील लेखात जिथे जिथे युनिकोड असा उल्लेख आहे तिथे संदर्भाप्रमाणे युनिकोड आधारित सध्याच्या सर्व उपप्रणाल्या अंतर्भूत आहेत. फक्त युनिकोड कंझॉर्टियम नव्हे. ह्या उपप्रणाल्या म्हणजे Input Method Editor (IME)/Keyboard, Unicode encoding, serialization, storage, retrieval systems, operating systems, rendering engine, support for Complex scripting, fonts, uniscribe or equivalent for character sequencing, display systems and end user applications)

एकीकडे युनिकोडमुळेच मराठी संगणकयुगात वावरु शकते ह्याचा अभिमान असताना युनिकोड देवनागरीच्या प्रमाणीकरण करताना झालेल्या घोडचुकांमुळे मराठी लिपी (देवनागरी) चे सौंदर्य, वैशिष्ट्ये व विविधता ह्या सर्वांना धोका निर्माण झाला आहे.

हे गौडबंगाल अनेक तंत्रज्ञांना अजून कळले नाहीये तर सामान्य जणांना विचारतोच कोण!

हा विषय खूपच व्यापक आणि क्लिष्ट आहे आणि त्यामुळे बरेच लोक ते समजून घ्यायच्या भानगडीत सुद्धा पडत नाहीत.. शिवाय ह्यातील सर्वसमावेशक असे विवेचन लिहायला गेल्यास एक ग्रंथ लिहीता येइल.

बऱ्याच लोकांना हा लेख कशासाठी लिहीला आहे असाही प्रश्न पडण्याची शक्यता आहे. पण इथे येणारे बरेच लोक हे संगणक कुटण्याची कामे करतात त्यामुळे लोकांची ह्याबाबत नेमकी मते काय आहेत, तसेच ज्यांना ह्याबद्दल उत्सुकता आहे पण जाणून घ्यायला जमले नाही त्यांना थोडेफार आकलन व्हावे मग किती जणांना हा खरोखर प्रॉब्लेम वाटतो का? व वाटलाच तर तो कसा सोडवता येइल ह्याबाबत मला जाणून घ्यायचे आहे.

हा विषय इथे शास्त्रशुद्ध पद्धतीने मांडावा असे बरेच दिवस मनात होते, पण वेळेअभावी व येथे रोजच येणे शक्य नसल्याने पुढे ढकलत होतो. युनिकोडला १७ वर्षे आणि युनिकोड देवनागरी येउन १३ वर्षे लोटूनसुद्धा (माझ्या !) मनायोग्य असे प्रमाणीकरण झालेले नाही व नजीकच्या भविष्यात तसे होण्याची चिह्नेही दिसत नाहीत.. केवळ काही अक्षरांना क्रमांक दिले म्हणजे प्रमाणीकरण असे ज्यांचे म्हणणे असेल तर ते झालेले आहे पण निर्दोष वापरण्याच्या दृष्टीने त्याचा उपयोग मर्यादितच राहिला आहे. ह्यामध्ये इतर प्रणाल्यांवर जी जबाबदारी सोपविण्यात आली आहे त्यामुळे हा प्रश्न व त्याची उत्तरे खूपच गुंतागुंतीची झाली आहेत.

सर्वसामान्य माणसाच्या अपेक्षा फारच थोड्या – म्हणजे मराठीत दिसणे, अचूकपणे लिहीता येणे, इमेल पाठवता येणे व पलीकडील संगणकावर ‘तसेच्या तसे’ दिसणे – इतक्या माफक असून त्यादेखील अजून पूर्णपणे साध्य झालेल्या नाहीत. (इथे प्रौढी मिरवायचा हेतू नव्हे, पण ज्या १० वर्षांपूर्वीच किरण फॉण्टने सोप्या पद्धतीने करुन दाखवल्या होत्या)

वास्तविक पहाता प्रमाणीकरणाकडून ह्यापेक्षा खूप जास्त अपेक्षा आहेत

प्रमाणीकरणाकडून अपेक्षा व युनिकोडने पूर्ण न होउ शकलेल्या सध्याच्या समस्या

१. टाइप करण्यासाठी सोपी, एकसमान व प्रमाणित पद्धत. ह्यातील प्रत्येक गरज अत्यंत महत्वाची आहे.

a. जवळजवळ प्रत्येक मराठी साईटवर युनिकोड टाईप करण्यासाठी वेगवेगळया पद्धती आहेत.

b. शिवाय Online / Offline IME, Keyboard Overlays, Transliterators programs (‘मिन्गलिश’ मध्ये लिहिलेले देवनागरीत बदलणारे) असे असंख्य प्रकार आहेत.

c. मुख्य म्हणजे ह्यातल्या एकाही पद्धतीत सर्वच्या सर्व मराठी भाषेतील देवनागरी अक्षरे जशी यायला हवीत तशी लिहीता येतीलच असे ठामपणे म्हणता येत नाही. ह्यातील काही कारणे त्या पद्धतीत असली तरी काही कारणे युनिकोडच्या सदोष एनकोडींगवर तर काही विविक्षीत फॉण्ट तर काही Operating Systems वर आधारित आहेत.

d. Minglish आधारित पद्धत मला तत्वतः अजिबात मान्य नाही. जरी त्यात कामचलाऊ मराठी लिहीता येत असले तरी बोजड संस्कृत मधील श्लोक लिहायला गेल्यास अवघड जागेचे दुखणे होऊन बसते!

२. सर्व आघाडीच्या संगणक प्रणाली (ऑपरेटींग सिस्टमस्) मध्ये मान्यता. (विंडोज, लिनक्स, मॅक)

a. युनिकोडमध्ये टाईप केलेला मजकूर सर्व प्रणालीत जसाच्या तसा दिसत नाही. अर्धा र Apple मधल्या A च्या उच्चाराचे मराठी अक्षर, सर्व काना, मात्रा, विशेषतः र् हस्व वेलांटी ह्यात अनेक दृष्टीआड करता न येण्यासारख्या त्रूटी आहेत.

३. सर्व संगणक कार्यक्रमात (प्रोग्रॅम्स) समान आचरण – मजकुराची प्रत एका कार्यक्रमातून दुसरीकडे नेल्यास अक्षरांची फेरफार न होणे.

a. उदा. Microsoft Word मध्ये युनिकोडमधला केवळ ‘काना’ टाइप करता येत नाही. त्याअगोदर एखादे अक्षर असणे आवश्यक असते. मात्र हीच गोष्ट नोटपॅडमधे शक्य आहे! तसेच Word मधेच Insert Symbol वापरुन थेट युनिकोड Enter केल्यास ते करता येते. असे का? ह्याचे उत्तर मला तरी मिळालेले नाही.

b. अनेक प्रोग्रॅम्स अजूनही युनिकोड पूर्णपणे सपोर्ट करत नाहीत. अनेक प्रोग्रॅम्स एकतर Unexpected character strings मुळे क्रॅश होतात अथवा अपेक्षेप्रमाणे चालत नाहीत. (ह्यामध्ये ऱ्हस्व वेलांटी अक्षराच्या नंतर दिसणे, अर्धा र बरोबर न दिसणे, जोडाक्षरे व्यवस्थित न दिसणे, ? किंवा चौकोन दिसणे इ प्रकार अंतर्भूत आहेत). अनेक Photo Editor, Image Processing, Animation, Desk Top Publishing चे प्रोग्रॅम्स ह्यात अंतर्भूत आहेत.

४. मराठीतील सर्व मुळाक्षरे व जोडाक्षरे त्यातील लिपीच्या संकेतानुसार लिहीता येणे

a. ह्यात अर्धा र, पहिली वेलांटी, अ अधिक काना म्हणजेच आ, क्ष व ज्ञ ह्यांना (विशेष संयुक्त) मुळाक्षरे म्हणून मान्यता, व्यंजनांच्या अर्धस्वरुपाला व प्रचलित जोडाक्षरांना प्रमाणित स्थान, इ मुद्दे येतात.

५. संगणकाच्या पद्धतीने क्रमित (सॉर्ट) केल्यास वर्णमालेच्या क्रमाने लावता येणे

a. देवनागरी ही लिपी अनेक भाषांसाठी वापरली जात असल्याने आणि प्रत्येक भाषेचा वर्णानुक्रम थोडाफार वेगळा असल्याने हा गोंधळ निर्माण झाला असला तरी सध्याचा युनिकोड मधला क्रम ही कुठल्याच भाषेतील वर्णमाला नाहीए.

b. क्ष ने सुरु होणारे शब्द क व ख च्या मध्ये येतात तर ज्ञ ने सुरु होणारे शब्द चक्क ज व झ च्या मधे येतात! युनिकोड देवनागरी तक्ता ह्या दोन्ही अक्षरांना जोडाक्षरे मानतो.

c. ह्याशिवाय इतर अनेक अक्षरे युनिकोडच्या अनुक्रमात अक्षरशः घुसडलेली आहेत जी देवनागरीत कधीही अस्तित्वात नव्हती (उदा. ऒ ऍ ऎ ॊ ॆ). ह्याला इतर भारतीय भाषांशी अनुरुपता असे नाव दिले आहे, मात्र वास्तवात ती शोभेचीच ठरावीत. वास्तविक हे ISCII ने केलेले Work Around होते मात्र ते युनिकोड मधे तसेच अकारण आले आहे.

६. लिपीची वैविध्यता व शैली लक्षात घेऊन लिहीण्याचे स्वातंत्र्य एकाच टंकात (फॉण्ट) लेखकास बहाल करणे जेणेकरुन लेखक त्याच्या पसंतीनुसार निवड करु शकेल

a. आपली लिपी प्रत्येकाला अनेक पर्याय बहाल करते. उदा. अश्व हा शब्द आपण अ, श् व असाही लिहू शकतो. मात्र युनिकोड मध्ये ते जोडाक्षर कसे दिसावे हे फॉण्ट मधले टेबल व रेंडरींग ईंजिन ठरवत असल्याने लेखकाला ती निवड करता येत नाही. सर्व जोडाक्षरांसाठी हाच नियम लागू होतो.

७. मुख्य म्हणजे देवनागरी ही बोलीभाषा नसून लिपी असल्याने निर्माण केलेले प्रमाण छपाई व प्रदर्शन (डिस्प्ले) ह्यांना सर्वप्रथम प्राधान्य देऊन केलेले असावे.

a. मुळातच लिहीण्याच्या शैलीवर कोणताही प्रतिबंध मला स्वतःला अमान्य आहे. Roman अक्षरे लिहीताना जर एखादे चुकीचे स्पेलींग लिहीले तर कोणताही एडीटर त्यास अटकाव करत नाही. स्पेल चेकर त्यातील चूक दाखवून देऊ शकतो, पण ती मान्य / अमान्य करणे लेखकाच्या हातात ®®असते. मात्र युनिकोड देवनागरीसाठी ह्याचे स्वातंत्र्य नाही.

b. म्हणजेच जर मला मुद्दाम होउन अ ला २ काने द्यायचे असतील तर ते युनिकोड आधारित सध्याच्या प्रणालीमध्ये ते शक्य नाही.

c. ह्या उणीवेमुळे, देवनागरीच्या उपयोगावर निष्कारण प्रतिबंध येतो. उदाहरणार्थ, संगीतातली नोटेशन्स लिहायला देवनागरीत एक विशीष्ट पद्धत वापरतात (भातखंडे लिपी?). ती युनिकोडमध्ये लिहीता येत नाही.

८. टंकीत केलेला मजकूर कोणालाही कुठल्याही प्रणालीवर संपादित करुन इतर भागास धक्का न पोचता पाठवता यावा.

a. आधी सांगितल्याप्रमाणे युनिकोड देवनागरीमधल्या मजकूरातील काही अक्षरे किंवा जोडाक्षरे विविध प्रणालींवरती वेगवेगळा दिसतो त्यामुळे एका पणालीमध्ये केलेली दुरुस्ती पुन्हा दुसऱ्या प्रणालीत चुकीची दिसते

ह्याचा एकत्रित परीणाम हा झाला आहे की ज्यांना शुद्ध मराठी येते त्यांनादेखील एखादे अक्षर संगणकावर कसे लिहावे ते माहित नसल्याने अशुद्ध लिहीले जाते आणि अनेक संकेतस्थळांवर असे अशुद्ध मराठी कायमस्वरुपी जतन केले जात आहे.

अर्थात मग युनिकोड एकदमच टाकाऊ आहे का? तर नाही. युनिकोडमुळे देवनागरीला non-sharable असे स्थान मिळाले आहे. Microsoft, Apple, Google, Adobe अशा बड्या धेंडांच्या Sub-system Implementation सपोर्ट मिळाल्यामुळे आजच्या काही ब्रोऊजर्स मध्ये तरी देवनागरी दिसू शकते. इमेल वेगवेगळ्या सर्व्हर्समधून जात असल्याने आणि त्यातल्या एकाही दुव्यात युनिकोड Encoding Compatibility नसेल तर पलिकडील संगणकावर बरोबर दिसेल ह्याची खात्री देता येत नाही. पण याहू, जीमेल अशा वेब बेस्ड सिसटीम्स मधे बऱ्यापैकी कम्पॅटिबिलिटी आहे.

सर्वसाधारणपणे असे म्हणता येइल की वेब बेस्ड सिस्टीम्स ह्या बऱ्यापैकी अद्ययावत असल्याने त्यांनी युनिकोड अनुरुपतेत बऱ्यापैकी बाजी मारली आहे. मात्र अशी Softwares ज्यांना Internationalization करुन कोणताच जास्त आर्थिक फायदा नाही त्यांनी युनिकोडशी अनुरुपता करण्याचे टाळले आहे किंवा तो त्यांचा प्राधान्यक्रम नाही. एखादा प्रोग्रॅम युनिकोड अनुरुप करणे ही साधीसुधी गोष्ट नाहीए, त्यासाठी आमूलाग्र बदल आवश्यक असतो, इतका की कधी कधी त्यापेक्षा तो पुनर्निर्मित करणे सोपे पडावे. ह्याविषयी पुन्हा केव्हातरी.

पण हेही एक कारण आहे की ज्यामुळे सर्व प्रोग्रॅम्स आजही युनिकोडशी अनुरुप नाहीत आणि ते होण्याची शक्यताही नाही. असो.

काही महत्वाच्या पोष्ट्स व त्याची उत्तरे

किरण | 12 June, 2010 - 21:26

सर्वांच्या प्रतिसादासाठी पुन्हा एकदा धन्यवाद. तसेच सर्वांना वेळेअभावी उत्तर देता येत नसले तरी जमेल तसे वाचत आहे. त्यामुळे एखाद्या प्रश्नाला उत्तर द्यायचे राहून गेले असेल तर मला विपूत लिहावे. जसे जमेल तसे मी लिहीन. कोणाचाही अनुल्लेख करायचा हेतू नाही आणि कोणतीही शंका अयोग्य नाही.

गजाननः तुमचे प्रश्नही योग्य आहेत. आणि त्यात बाळबोध असे काहीही नाहीत. मलादेखील कधीना कधी ते पडलेच होते आणि अजूनही सर्वांची योग्य उत्तरे माहित आहेतच असेही नाही. किम्बहुना मी अनेकांशी बोलूनदेखील बर्‍याच जणांना अनेक महत्वाच्या गोष्टींची सुद्धा माहितीच नसल्याचे जाणवले.

मी माझ्या मतिप्रमाणे त्याची उत्तरे द्यायचा प्रयत्न करतो.

> फॉण्ट निर्मितीची प्रक्रिया नेमकी काय असते?
उ. फॉण्ट निर्मितीची थोडक्यात प्रक्रिया अशी: (मात्र त्यात युनिकोड आधारित फॉण्ट बनवणे ह्यात अनेक क्लिष्ट गोष्टी आहेत त्याबद्दल मी नन्तर लिहीन. )
फॉण्ट वापरुन आपल्याला जी अक्षरेदिसायला हवीत त्यांचे डिझाईन कागदावर मोठ्या आकारात तयार करणे.
ती स्कॅन करुन विशीष्ट टूल्स वापरून त्यांचे vectorization करणे. देवनागरी फॉण्ट्ससाठी शिरोरेखेचे भान ठेवणे अतिशय आवश्यक असते कारण ती सलग, सारख्या जाडीची आणि एकाच उंचीची दिसणे अतिशय महत्वाचे असते. ही फाईन अ‍ॅड्ज्स्ट्मेण्ट प्रत्येक अक्षरासाठी मॅन्युअली करावी लागते. तसेच प्रत्येक फॉण्ट साईजला सर्व अक्षरे बरोबर दिसतात की नाही, ई अनेक गोष्टी पहाव्या लागतात. नन्तर विवक्षीत टूल्स वापरुन मानकाप्रमाणे अक्षरे योग्य सांकेतांकाना जोडून घेणे. ही ASCII व True Type Font बनवण्याची पद्धत झाली.

मात्र युनिकोड देवनागरीसाठी Open Type Font वापरावा लागतो आणि त्यात अतिशय क्लिष्ट असे Rules scripting करावे लागते. त्याच्या तपशीलात मी सध्या शिरत नाहीये.

> एखाद्या लिपीला युनिकोडमध्ये स्थान मिळवण्यासाठी काय करावे लागते?
उ. युनिकोड कंझॉर्टियम ही एक स्वायत्त संस्था आहे. http://www.unicode.org ह्या दुव्यावर अधिक माहिती मिळु शकेल.
मात्र ह्यात स्थान मिळवण्यासाठी काय करावे लागते त्याचा तपशील मला माहित नाही.

> त्यात पुन्हा बदल करायचे असतील तर काय करावे लागते? बदलाला कोणाची मान्यता असायला लागते. यात मदत करायची इच्छा असल्यास कोणाच्या संपर्कात राहिले पाहिजे?
उ. युनिकोडच्या स्थापना झाल्यावर त्याच्या प्रमोटर्सनी जगातील सर्व writing systems चा सर्वे घेउन काही भाषा निश्चित केल्या तसेच जरी ही नॉन प्रॉफिट ऑर्गनायझेशन असली तरी त्यावर त्याच्या promoters चा खूप प्रभाव आहे. त्यामूळे जरी एखादा बदल सजेस्ट केला तरी तो अमलात यावा अथवा नाही ह्यावरती अंतिम निर्णय जरी त्यांना भाषेबाबत काहीही माहिती नसली तरी तेच घेऊ शकतात. आणि ह्यामुळेच साध्या साध्या गोष्टींसाठी सुद्धा (मराठीतला अर्धा र, बंगालीमधला खण्ड त) खूप पाठपुरावा करावा लागतो असे ऐकून आहे. शिवाय ह्यात कालापव्यय झाल्याने तोपर्यंत इतर प्रणाल्यांमधे त्रुटी राहून जातात आणि नन्तर जरी त्यात बदल झालाच तरी इतर प्रणाल्यांवर जी जबाबदारी सोपविली आहे त्याचे निर्माते वेगवेगळे असल्याने तसेच त्यांना हे बदल अमलात आणायचे कुठलेच बंधन नसल्याने हे बदल आपल्यापर्यंत पोचण्यास अनेक वर्षे जातात. युनिकोड्चे आत्तचे version 5.2 आहे. जवळ जवळ सर्व मेजर व्हर्जन मध्ये देवनागरी अक्षरे त्यात टाकली गेली मात्र युनिकोड आधारित फॉण्ट मधे त्याची अंमल्बजावणी त्या त्वरेने होऊ शकत नाही.

एकाच लिपीचे वेगवेगळे फॉण्ट युनिकोडमध्ये असू शकतात का? (वर तुम्ही ६४००० गुणिले १७ असा हिशेब दिला आहे. म्हणजे प्रत्येक लिपीच्या / भाषेच्या वाट्याला मर्यादित युनिकोड येत असतील ना?)

उ. हो. आणि ते असायलाच हवेत, तरच काहीतरी उपयोगी गोष्ट घडू शकते. मात्र देवनागरी युनिकोड फॉण्ट कसे बनवावेत ह्याबाबत अतिशय कमी माहिती सध्या उपलब्ध आहे. जी आहे ती मी समजून घ्यायचा प्रयत्न केला पण ती जणू काही कोणाला समजू नये अशाच प्रकारे लिहीली असावी असे वाटावे असा संशय यावा अशी परिस्थीती आहे. अर्थात हे माझे स्वतःचे मत आहे. मात्र एक गोष्ट निश्चित की एक युनिकोड देवनागरी फॉण्ट बनवण्यासाठी लागणारे परिश्रम एका माणसाच्या आवाक्याबाहेर आहेत.

इतरांना ह्याबद्दल आणखी माहिती असेल तर कृपया द्यावी.

* संपादन
* प्रतिसाद

किरण | 13 June, 2010 - 00:27

अजय, हा तुझ्या काही इतर मुद्द्यांवरचा रीप्लायः
ज्या मुद्द्यांवरती तुझा रिप्लाय युनिकोडच्या आवाक्याबाहेर आहेत असा आहे, ते मलासुद्धा मान्य आहे, मात्र भारतीय - देवनागरी - मराठी - end user ह्या नात्याने उपलब्ध सोल्यूशन ने अनेक प्रश्न निर्माण केले आहेत.
त्याबद्दल हे सर्व.

>>>
१. तुझे मुद्दे बरोबर असले तरी युनिकोडच्या संदर्भात पटत नाही. मुळात Ascii पद्धत का सुरु झाली? तर वेगवेगळ्या Operating system मधे असलेला Data सहज एका संगणकावरून दुसरीकडे नेता यावा म्हणून. यात डाटा Input कसा करावा हे कुठेच लिहिलेले नाही. उदा. QWERTY पद्धतीची एकच input method असूनही Ascii आणि EBCDIC अशा दोन अंतर्गत पद्धती होत्याच की. त्यामुळे Unicode, फक्त एकदाच Unicode मधे असलेला Data कुठल्याही संगणकावर सारखा कसा वापरता येईल यासाठी तयार केली गेली आहे. IME चे प्रमाणिकी करण आवश्यक हा तुझा मुद्दा योग्य असला तरी युनि़कोडच्या आवाक्याबाहेरचा तो मुद्दा आहे.

रिप्लाय:
EBCDIC ह्या पद्धतीतही असेच अनेक दोष होते जसे की A साठी चा Code + 1, असे केल्यावर B चा कोड यावा इतके साधे logic सुद्धा त्यात नव्हते. म्हणजेच A to Z ला Continous Code Assignment नव्हती, त्यामुळे programmers च्या डोक्याला इतका अनावश्यक त्रास झाला की ती सिस्टीमच रद्दबातल झाली आणि ASCII अस्तित्वात आली.

"Information Interchange" इतके सिमीत objective जरी आपण युनिकोड च्या बाबतीत ठेवले तरी त्या त्या लिपीतील सर्व प्रमाणभूत अक्षरांना प्रमाणित स्थान मिळाले नसल्याने (अर्थात हे माझे मत आणि ह्याबाबत अनेक मतमतांतरे असू शकतात आणि ह्यासंदर्भात पलिकडूल बाजूचे काही मुद्दे देखील मला मान्य आहेत). उदाहरण द्यायचे झाले तर समजा आपण इन्ग्लिश करता प्रमाणीकरण करत आहोत आणि समजा त्यात X, Y, Z ही अक्षरेच घेतली नाहीत. आणि ती न घेतल्यामुळे होणारा घोळ थांबवण्यासाठी असे वर्क अराऊंड काढले की X म्हणजेच A*, Y म्हणजेच B*, Z म्हणजेच C*. अशा प्रकरचे घोळ युनिकोड मध्ये झाले आहेत. शिवाय नंतर पाठपुराव्यामुळे X, Y, Z त्यात घातले गेल्यावर होणारे घोळ तर अवर्णनीय आहेत.
त्यामुळे Backward Compatibility च्या नावाखाली वर्क अराऊंड ही व्हॅलीड ठरते आणि नवीन कोड सुद्धा!
आज अर्धा र लिहायच्या २ पद्धती अस्तित्वात आहेत

१. नुक्ता वाला र, पाय मोडायचे चिह्न
२. नेहमीचा र, पाय मोडायचे चिह्न, ZWJ (Zero Width Joiner)

शिवाय युनिकोड हे म्हणायला मोकळे आहेच की आम्ही थोडेच सांगितले होते की आमच्या वर आधारित सिस्टीम बनवा! आणि ते खरेच आहे. हे आपल्यालाच ठरवायचे आहे की आपण आहेत त्या त्रूटींसकट केवळ ते एकमेव मानक अस्तित्वात आहे म्हणून तसेच चालवून घ्यायचे की एखादे नवीन Open Source Standard वापरायचे?

>>>२ a. हा युनिकोडचा दोष नाही. युनिकोडच्या एका जुन्या आवृत्तीत अर्धा र (र्‍) नव्हता. TDIL ने त्याबद्दल पाठपुरावा करून तो नवीन आवृत्तीत आणला (२००४ मधे). त्याबद्दलची चर्चा अजूनही जालावर उपलब्ध आहे ( http://unicode.org/~emuller/iwg/p8/index.html) पण ती सुधारण झाल्यावर काही फाँट निर्मात्यांनी योग्य तो बदल केला काहीनी केला नाही हा युनिकोडचा दोष नाही. आजही W3 ने ठरवलेली सर्व प्रमाणे काही Browsers नीट अंमलात आणत नाही (उदा. IE 6 ) हा CSS किंवा HTML या प्रमाणांचा तो दोष नाही Microsoft सारखी कंपनी नीट अंमलात आणत नाही हा दोष आहे.

रिप्लाय:
हो पण users नी बोम्बाबोम्ब केली की लगेच ते त्यात सुधारणा करतात कारण त्याचा Direct Commercial Impact असतो. युनिकोड मराठी देवनागरी साठी जो user group आहे, त्याने ह्या कंपन्यांवर negligible commercial impact आहे. त्यामुळे जरी कोणी हे आक्षेप घेतले तरी त्याला शून्य priority मिळते. मूळात हा मोठा घोळ आहे हे समजण्यात आणि मान्य करण्यातच जिथे एकमत नाही तिथे सुधारणा होण्याची अपेक्षा करणेच चूक आहे.

>>>
तुला डाटाबेसची माहिती असेल तर हा क्ष आणि ज्ञ मधेच Sort होणे हा मुद्दा अनेक अभारतीय भाषांनाही आहे. त्यासाठी युनिकोडवर आधारित पण भाषेसाठी वेगळे collation sequences उपलब्ध आहेत. ते वापरले तर हा प्रश्न नाही.

रिप्लाय:
माझा मुद्दा हाच आहे की ASCII System मधे Roman Letters ना योग्य assignment केल्याने कोणतेही additional logic न लिहीता ती अक्षरे व्यवस्थित sort होतात. युनिकोडमधली अक्षरे Excel मधे Sort करुन पहा.

>>>६. लेखी लिहतांना स्वातंत्र्य असले तरी प्रत्यक्षात त्या स्वातंत्र्याचा किती उपयोग होतो हा विचार करणेही आवश्यक आहे. मांदारीन आणि कँटोनिज या भाषा संगणकावर आणताना अशा अनेक तडजोडी केल्या गेल्या. त्यामुळे भाषा तशीच्या तशी संगणकावर यायलाच हवी असे नाही.

रिप्लाय:
हे अजिबात मान्य नाही. भाषा ही त्यांच्या लिपीच्या संकेताप्रमाणे आणि योग्य रितीने यायलाच हवी. नाहीतर मिन्लिश काय वाईट? आपल्या मुलांना शिकवताना जर आपल्याला असे शिकवावे लागत असेल की 'मराठी' लिहायला 'maraaThI' टाईप कर तर आज इन्ग्रजी माध्यमात शिकणार्‍या मुलांना 'मराठी' हे 'maraaThI' असेच वाचायला देखील सोपे वाटते.

>७. अ पटले नाही. कुठला शब्द योग्य आहे का नाही हे दाखवणे त्या त्या Spellchecker वर अवलंबून आहे युनीकोडशी नाही. अगदी इंग्रजीतही color आणि colour हे चूक का बरोबर कुठला Spellchecker यावर अवलंबून आहे.

रिप्लाय:
नक्की काय पटले नाही ते कळले नाही. माझाही तोच मुद्दा आहे की स्पेलचेकर असताना अनावश्यक बन्धने कशाला?

>७. c. अजिबात पटले नाही. भातखंडे पद्धत देवनागरीशी जुळती असली तरी मुळात ती वेगळी लिपी/भाषा आहे. मी उद्या माझे संगीताचे नोटेशन काढले कि ज्यात सी शार्प ( C#) असा न लिहिता C च्या डोक्यावर शार्प असेल अशी खूण लिहायची. मला ती कागदावर लिहिता आली पण संगणकावर लिहिता आली नाही तर तो ASCII या प्रणालीचा दोष नाही.

रिप्लाय:
अजय, तुझ्या उदाहरणाप्रमाणे असेल तर मलाही मान्य आहे, मात्र ईथे तसे नाहीये. इथे असे आहे की मला C# सुद्धा लिहीता येणार नाही कारण तो valid english word नाही. भातखंडे लिपीत (चु. भु. घ्या. द्या.) मंद्र्सप्तकातील सा लिहीताना प्रत्येक स्वराखाली पाय मोडण्याचे चिह्न असते. जसे ग् . अर्थातच मन्गल फॉण्ट मधे सा चा पाय मोडण्याची सोय नाही. पुन्हा हा युनिकोड चा दोष नाही हे ऐकण्याची ईच्छा नाही, ते माहित आहेच. मात्र ह्यावर ज्या फॉण्ट मधे अशी सोय असेल असा फॉण्ट करा आणि वापरा असे उत्तर असेल (Technically only that solution is possible) आणि जरी ते केले तर एकच मजकूर वेगवेग्ळ्या फॉण्ट मधे वेगळा दिसणे हा अतिशय धोकादायक प्रकार सुरु होईल.

>>>८. पुन्हा एकदा: युनिकोडमधे एकदा असलेला मजकूर कुठल्याही प्रोग्रामला सारखाच दिसतो. तो आत टाकायची पद्धत (IME) आणि दृष्य पद्धत (Rendering) यात ज्या तृटी आहेत त्यामुळे मूळ प्रमाण चुकीचे होत नाही.

रिप्लाय:
ह्याच्यामुळे प्रमाण चु़कीचे होत नाही हे मान्य पण प्रमाणकात सुद्धा वर दाखवलेल्या त्रुटी आहेतच.

>>> कुठले अक्षर दुसर्‍या अक्षराच्या जवळ आल्यावर कसे दिसावे हे Unicode सांगत नाही ते काम एकतर Script engine करते किंवा त्याचे नियम त्या फाँट्मधेच असतात.

रिप्लाय:
नेमका हाच तर प्रोब्लेम आहे. प्रत्येक घटकाने हेच म्हटले की माझे काम मी उत्तम प्रकारे केले आहे आता पुढच्याने ते बरोबर नेले नाही त्याला मी जबाबदार नाही ते तुमचे तुम्ही बघा!

हे म्हणजे असे झाले की माझ्याकडे १kg चे 'प्रमाणित' वजन आहे पण ते फक्त माझ्याकडच्या तराजूत मोजले तरच. तुमच्या कडच्या तराजूत मोजले तर १kg तर नाहीच येणार पण किती येईल ते मी सांगू शकत नाही स्मित

>अनेक संकेतस्थळांवर असे अशुद्ध मराठी कायमस्वरुपी जतन केले जात आहे.
हे मला पटले नाही. पण घटकाभर असे धरून चालू की ते खरे आहे. पण प्रत्येक फाँट तयार करणारा त्याला वाटेल तशी प्रणाली करत होता तेंव्हा जो गोंधळ होता त्यापेक्षा ही सुधारणा आहे हे तुला पटतंय का?

रिप्लाय:
ही सुधारणा असावी अशी माझी मनापासून आणि कळकळीची अपेक्षा आहे पण माझ्या मतानुसार रोगापेक्षा इलाज भयंकर असे हे आहे. अर्थात मला जितके हे प्रखरतेने वाटते तितके सगळ्यांना वाटणारच असे नाही. ते प्रत्येकाच्या भाषेच्या आणि लिपीच्या प्रेमावरती अवलम्बून आहे. मी त्याचा जेवढा अधिक अभ्यास करतोय तितकेच ते मला अधिक प्रकर्षाने जाणवत रहातेय.

मी तर असे म्हणेन की अगदी कुठल्याही पुर्वीच्या देवनागरी फॉण्ट मधल्या सर्व अक्षरांना जरी युनिकोड मधे स्थान मिळाले असते तरी बर्‍याच प्रमाणात घोळ कमी झाला असता. मात्र सध्याचे नम्बरींग उच्चाराधिष्टीत केले गेले आहे आणि त्यातही सुसूत्रता नाही बाकी सर्व बाबी फॉण्ट, रेण्डरींग ईंजिन, ऑप्रेटींग सिस्टीम आणि अ‍ॅप्लिकेशन ह्यावर सोडलेल्या आहेत.

एकाच फॉण्ट्मधला (उदा. मंगल) मजकूर एकाच ऑपरेटिंग सिस्टीम (विंडोज) मध्ये वेगळ्या अ‍ॅप्लिकेशन्स मध्ये वेगळा दिसतो ह्या गोन्धळाला काय म्हणावे? आणि मी युनिकोड सपोर्टेड अ‍ॅप्लिकेशन्स म्हणत आहे. अनसपोर्टेड अ‍ॅप्लिकेशन्स नव्हेत. ह्यात केवळ underlying character code sequence same आहे ह्यावर मी तरी समाधानी राहू शकत नाही. पुर्वीच्या फॉण्ट्मध्ये निदान एकदा लिहीलेला मजकूर दुसरीकडे पेस्ट केला तर तो फॉण्ट इन्स्टॉल्ड असेल तर १००% नक्की तसाच दिसणार ही खात्री होती. आता तसे नाही.

शिवाय मी म्हटल्याप्रमाणे हे लिपी चे प्रमाणीकरण आहे भाषांचे नव्हे. त्यामुळे लिखीत खूणांचे प्रमाणीकरण आवश्यक आहे, उच्चाराप्रमाणे नव्हे. लिखीत खूणा उच्चाराप्रमाणे असणे हे आपल्या भाषांचे वैशिष्ट्य आहे मात्र ते १००% बरोबर नाहीए आणि नेमके हेच गृहितक युनिकोड चे नंबरींग करताना धरले गेले जे असे असायला नको होते.

वास्तविक देवनागरी लिपी ही इतकी Scientific आहे हे मला त्यावर अधिकाधिक माहिती घेतल्यावर कळत जात आहे.

अजय, वेगवेगळ्या फॉण्ट्सचा वापर ह्याने थांबला असता तर नक्कीच ते आवडले असते. पण तेही उद्दिष्ट साध्य होत नाहीये. आजही प्रिंट मिडीया, पब्लिशींग हाऊस, Visual and Creative signs येथे अजूनही वेगवेगळ्या प्रणाल्या चालूच आहेत कारण त्यांना हे मनमानी रुल्स परवडणारे नाहीत.

वेबवरचा उपयोग हा मी कॅज्युअल मानतो (माहितीची देवाण घेवाण म्हणजे तो महत्वाचा नाहीए असे नाही पण तो एकच उपयोग नाहीए) आणि सध्यातरी तेवढ्याच उपयोगापुरता युनिकोड चा उपयोग मर्यादित राहिला आहे. अगदी गूगल सर्च करण्यासाठी सुद्धा ह्यात अनेक त्रुटी आहेत. कारण एका शब्दाचे एकच स्पेलिंग असावे हेदेखील होऊ शकलेले नाहीये.

शासनाच्या कारभाराकरता युनिकोडचा वापर करावा हा अध्यादेश सुद्धा नॉन युनिकोड प्रणाल्यात टाईप करावा लागतो ह्यापेक्षा मोठा विनोद काय असेल?

>>> मुळात युनिकोड आधारीत सगळ्या प्रणाली याच एका लेखात अंतर्भूत करणे हे योग्य नाही असे माझे प्रामाणिक मत आहे. उदा. माझ्या मोबाईलवर एक जर्मन साईट नीट दिसत नाही म्हणजे सगळे HTML, CSS, Fonts, मोबाईलची OS, mobile browser सगळे अंतर्भूत करून HTML योग्य नाही म्हणण्यासारखे आहे.

रिप्लाय:
नाही. उलट असा समग्र विचारच करणे आवश्यक आहे. माझ्या मनात ह्याबद्दलच्या सोल्यूशनचा आराखडा तयार ही होत आहे मात्र त्यात अनेक तज्ञांचा सहभाग आवश्यक आहे.

विषय: 
Group content visibility: 
Public - accessible to all site users

तू म्हणतोस तसे अनेक भलतेच अक्षरं भलतेच उमटत आले आहेत. अक्षर जोडणी, बांधणी निट नाहीत पण त्यावर उपाययोजना चालू आहे असे वाटते. उदा. मोबाईल मध्ये पुर्वी ललीत हे ललति असे दिसायचे, पण आता अश्या जोडन्या निट झाल्या आहे, करणे चालू आहे.

विषयाची व्याप्ती मोठी असल्याकारणाने विचार करुनच लिहावे लागणार. Happy विषय फारच मस्त आहे.

किरण हे कुणीतरी जाणकार व्यक्तीने लिहिले ते बरे झाले. (म्हणजे त्या लोकांनाही ते जाणवते आहे, हे बघून खुप छान वाटले.)
आपली एस आर के, मराठीत श्रुती होतेय, आणि अळंबी, मश्रुम होतेय. इथेच नेमका श्र का अडतोय ?

मला लेख आवडला. पटला.
युनिकोडचे बरेच तोटे आहेत खरं, पण इतर फाँट्स लिहायला अवघड वाटतात एकदा याची सवय झाली की.
बाकी युनिकोडमध्ये नीट न दिसणार्‍या शब्दांबाबत - मी तेव्हढी व्याकरण, भाषा-लिपीप्रेमी नसल्याने मला ते चालून जात होतं. पण आपली लिपी जशीच्या तशी दिसणे हे महत्वाचे आहेच. त्यामुळे आता एकदा युनिकोड का होईना पण आपली देवनागरी लिपी इथे आंतरजालावर रूळली आहे म्हटल्यावर तिला अजुन पर्फेक्ट बनवण्याचे प्रयत्न व्हावेत असे वाटते. ( स्वतःला त्यात काही करता येत नसल्याने केवळ वाटण्यावरच समाधान. )

किरण, चांगली माहिती आहे. यात कुठलीच भर घालू शकण्याइतकं मला त्यातलं ज्ञान नाही.

एक सहज लक्षात आलेली सुधारणा सुचवू का?
>> मुळातच लिहीण्याच्या शैलीवर कोणताही प्रबंध मला स्वतःला अमान्य आहे.
इथे 'प्रबंध'च्या जागी 'प्रतिबंध' हवं आहे.

लेख आवडला. बर्‍याचश्या तांत्रिक बाबी कळल्या नाहीत तरी बर्‍याच संगणकप्रणालीं मध्ये ही सोय नाही असं नेहमीच वाटतं. ऑपरेटींग सिस्टीम च्या मार्गाने काही करता येईल का असं मला बरेचदा वाटतं. पण तेही सोपं निश्चितच नसेल. बर्याच भानगडी होतील. वेब बेस्ड सिस्टीम्स मध्ये सोयी आहेत पण प्रत्येक ठिकाणी सारखेच नियम असतील असं नसतं. त्याचाही त्रास होतो. ह्याचा उल्लेख तुम्ही केलाच आहे.
इतरही भाषांच्या लिपीसाठी असे त्रास असावेत असं वाटतं. जिथे भाषेचा/लिपीचा प्रसार असेल तिथे हा मुद्दा येणार नाही. कारण त्या त्या भौगोलीक विभागा साठी बहुतेक संगणक्प्रणाली विकसीत केलेल्या असतात. पण प्रत्येक ठिकाणी मात्र हे सहज शक्य नाही.

किरण हा विषय इथे मांडल्या बद्दल तुझे आभार.

देवनागरी लिपी हाताने लिहिणे सोपे आहे. पण सध्याच्या प्रमाणीत किबोर्ड सारख्या इन्पुट माध्यमा करता कितपत योग्य आहे? योग्य नसेल तर अशी एखादी नवी लिपी बनवणे फायद्याचे नाही का? (भविश्याच्या द्द्रुष्टीने)

युनिकोड मधले सध्याचे देवनागरी प्रमाणी करण कसे आहे हेदर्शवाणारे दुवे देउ शकशील का? किंवा तुच ह्यावर अजून प्रकाश टाकला तरी चालेल.

>>ज्यांना Internationalization करुन कोणताच जास्त आर्थिक फायदा नाही त्यांनी युनिकोडशी अनुरुपता करण्याचे टाळले आहे होणार

हे बदल हळुहळूच होणार. बाकी लेख सविस्तरपणे वाचून प्रतिक्रीया देतो.

.

स्वाती, सुधारणा केली आहे. सुचने बद्दल धन्यवाद. स्मित

इतके सगळे रिस्पॉन्स येतील असं वाटलं नव्हतं. त्यामुळे सर्वांना धन्यवाद!

केदारः तू हे कुठल्या फोनबद्दल म्हणत आहेस? तू म्हणत असलेला प्रॉब्लेम (ललित ऐवजी ललति) हा uniscribe किंवा complex scripting support ह्या गोष्टी operating system मधे नसल्याने किंवा योग्य रितीने configured नसल्याने येतो.
हे solve करण्यासाठी तू काय केलेस? (जसेकी firmware upgrade/configuration/setting changes)

दिनेश: धन्यवाद!
आपली एस आर के, मराठीत श्रुती होतेय, आणि अळंबी, मश्रुम होतेय. इथेच नेमका श्र का अडतोय ? >>> हे नक्की कळलं नाही.

बस्के: तु़झी प्रतिक्रिया प्रातिनिधीक असावी पण मायबोलीत लिहायची पद्धत म्हणजेच युनिकोड फॉन्ट हा एक सर्वसामान्य गैरसमज आहे. वास्तविक, ही सुविधा फक्त एक ऑनलाइन IME आहे. अर्थातच पुर्वी आपण mingish वापरत असल्याने ही पद्धत सोयीस्कर वाटते. ह्या पद्धतीचा आणि युनिकोड फाँटचा तसा काही संबंध नाही. किंबहुना, अगदी ह्याच पद्धतीने कोणत्याही फाँन्ट मधे लिखाण करणे शक्य आहे.

नविना: युनिकोड द्वारे संगणकावर देवनागरी दिसण्यासाठी मी वर उल्लेखलेल्या सर्व उपप्रणाल्यांवर वेगवेगळी जबाबदारी सोपविण्यात आलेली आहे. त्यातील सगळेच घटक operating system मधे समाविष्ट नाहित. ह्यातील कुठलाही एक घटक नीट काम करत नसेल तर आपल्याला कुठलीतरी त्रुटी दिसते.

देवनागरी लिपीचा सर्वात मोठा problem हा आहे कि ती हिंदी, मराठी, संस्कृत ह्याबरोबरच जवळजवळ १५ वेगवेगळ्या भाषांसाठी वापरली जाते, त्यामुळे देवनागरी वापरणार्‍या भाषांमधील गोंधळ जास्त आहे. जसेकी ळ आणि अर्धा र (र्‍) हा फक्त मराठीत वापरला जातो, हिंदीत नव्हे.

पेशवा: युनिकोड संदर्भात आणि एकंदरीतच यातल्या इतिहासाबद्दल माझ्याकडे बराच मजकुर उपलब्ध आहे. इतरांनाही त्यात स्वारस्य वाटल्यास मी ते वेळ होइल तसे इथे लिहिन.

नंद्या: प्रतिक्रियेची वाट पहातोय. स्मित

देवनागरी लिपीच दोन्ही कडे असल्याने गुगलमध्येही बरेचदा हिंदीच लिंक्स येतात, एक्सेप्ट काही विशिष्ट मराठी शब्द..
किरण जरूर लिहा या विषयावर.

किरण इथे लिहिलंस छान केलंस. बर्‍याच दिवसापासून तुझ्याशी या विषयावर बोलायचं होतं आता इथेच लिहितो.

१. तुझे मुद्दे बरोबर असले तरी युनिकोडच्या संदर्भात पटत नाही. मुळात Ascii पद्धत का सुरु झाली? तर वेगवेगळ्या Operating system मधे असलेला Data सहज एका संगणकावरून दुसरीकडे नेता यावा म्हणून. यात डाटा Input कसा करावा हे कुठेच लिहिलेले नाही. उदा. QWERTY पद्धतीची एकच input method असूनही Ascii आणि EBCDIC अशा दोन अंतर्गत पद्धती होत्याच की. त्यामुळे Unicode, फक्त एकदाच Unicode मधे असलेला Data कुठल्याही संगणकावर सारखा कसा वापरता येईल यासाठी तयार केली गेली आहे. IME चे प्रमाणिकी करण आवश्यक हा तुझा मुद्दा योग्य असला तरी युनि़कोडच्या आवाक्याबाहेरचा तो मुद्दा आहे.

२ a. हा युनिकोडचा दोष नाही. युनिकोडच्या एका जुन्या आवृत्तीत अर्धा र (र्‍) नव्हता. TDIL ने त्याबद्दल पाठपुरावा करून तो नवीन आवृत्तीत आणला (२००४ मधे). त्याबद्दलची चर्चा अजूनही जालावर उपलब्ध आहे ( http://unicode.org/~emuller/iwg/p8/index.html) पण ती सुधारण झाल्यावर काही फाँट निर्मात्यांनी योग्य तो बदल केला काहीनी केला नाही हा युनिकोडचा दोष नाही. आजही W3 ने ठरवलेली सर्व प्रमाणे काही Browsers नीट अंमलात आणत नाही (उदा. IE 6 ) हा CSS किंवा HTML या प्रमाणांचा तो दोष नाही Microsoft सारखी कंपनी नीट अंमलात आणत नाही हा दोष आहे.

३ युनिकोडमधला डाटा एका संगणकावरच्या "प्रोग्रामला" (व्यक्तीला नाही) जसा दिसतो तसाच तो डाटा दुसर्‍या संगणकावर नेला तर तिथल्या "प्रोग्रामला" दिसतो. जो युनिकोडचा मुख्य उद्देश होता.
३ a. पुन्हा हा IME चा दोष आहे. युनिकोडचा नाही.
३b मुद्दा बरोबर तो युनिकोडचा दोष नाही. आणि युनिकोडवर व्यवस्तित चालणारे प्रोग्राम हळूहळू वाढत आहे.
४, ५. माझ्या माहितीप्रमाणे (क्ष आणि ज्ञ सोडले तर) अक्षरक्रम योग्य आहे. आणि अर्धा र (र्‍) आपण कधी बाराखडी म्हणताना वापरत नाही. मराठी खेरीज इतर भाषा देवनागरीतून व्यक्त होत असल्याने काही अधिक मुळाक्षरे मधे आली आहेत इतकेच.
http://unicode.org/charts/collation/chart_Devanagari.html
तुला डाटाबेसची माहिती असेल तर हा क्ष आणि ज्ञ मधेच Sort होणे हा मुद्दा अनेक अभारतीय भाषांनाही आहे. त्यासाठी युनिकोडवर आधारित पण भाषेसाठी वेगळे collation sequences उपलब्ध आहेत. ते वापरले तर हा प्रश्न नाही. अजून मराठीसाठी नाही म्हणजे कधिच होणार नाही असे नाही. उदा utf8_czech_ci, utf8_polish_ci,utf8_slovak_ci,utf8_slovenian_ci हे त्या त्या भाषेसाठी पण अगदी थोडा फार बदल असलेले collation sequences आहेत. पण हे प्रत्यक्षात आणायची जबाबदारी डाटाबेस तयार करणार्‍या कंपन्यांची आहे. किंवा MySQL सारखे सॉफ्टवेअर मुक्तस्रोत असल्याने, त्यावर कामकरणार्‍या स्वयंसेवकांची आहे. आता सगळ्याच मुक्तस्रोत प्रणालींवर काम करणारे भारतीय इतके कमी का हा वेगळा चर्चेचा विषय आहे.

६. लेखी लिहतांना स्वातंत्र्य असले तरी प्रत्यक्षात त्या स्वातंत्र्याचा किती उपयोग होतो हा विचार करणेही आवश्यक आहे. मांदारीन आणि कँटोनिज या भाषा संगणकावर आणताना अशा अनेक तडजोडी केल्या गेल्या. त्यामुळे भाषा तशीच्या तशी संगणकावर यायलाच हवी असे नाही.

७. अ पटले नाही. कुठला शब्द योग्य आहे का नाही हे दाखवणे त्या त्या Spellchecker वर अवलंबून आहे युनीकोडशी नाही. अगदी इंग्रजीतही color आणि colour हे चूक का बरोबर कुठला Spellchecker यावर अवलंबून आहे.

७. c. अजिबात पटले नाही. भातखंडे पद्धत देवनागरीशी जुळती असली तरी मुळात ती वेगळी लिपी/भाषा आहे. मी उद्या माझे संगीताचे नोटेशन काढले कि ज्यात सी शार्प ( C#) असा न लिहिता C च्या डोक्यावर शार्प असेल अशी खूण लिहायची. मला ती कागदावर लिहिता आली पण संगणकावर लिहिता आली नाही तर तो ASCII या प्रणालीचा दोष नाही.

८. पुन्हा एकदा: युनिकोडमधे एकदा असलेला मजकूर कुठल्याही प्रोग्रामला सारखाच दिसतो. तो आत टाकायची पद्धत (IME) आणि दृष्य पद्धत (Rendering) यात ज्या तृटी आहेत त्यामुळे मूळ प्रमाण चुकीचे होत नाही.

कुठले अक्षर दुसर्‍या अक्षराच्या जवळ आल्यावर कसे दिसावे हे Unicode सांगत नाही ते काम एकतर Script engine करते किंवा त्याचे नियम त्या फाँट्मधेच असतात.

>अनेक संकेतस्थळांवर असे अशुद्ध मराठी कायमस्वरुपी जतन केले जात आहे.
हे मला पटले नाही. पण घटकाभर असे धरून चालू की ते खरे आहे. पण प्रत्येक फाँट तयार करणारा त्याला वाटेल तशी प्रणाली करत होता तेंव्हा जो गोंधळ होता त्यापेक्षा ही सुधारणा आहे हे तुला पटतंय का?

मुळात युनिकोड आधारीत सगळ्या प्रणाली याच एका लेखात अंतर्भूत करणे हे योग्य नाही असे माझे प्रामाणिक मत आहे. उदा. माझ्या मोबाईलवर एक जर्मन साईट नीट दिसत नाही म्हणजे सगळे HTML, CSS, Fonts, मोबाईलची OS, mobile browser सगळे अंतर्भूत करून HTML योग्य नाही म्हणण्यासारखे आहे.

अरे अगदीच डोक्यावरुन वगैरे काही गेल नाही, कारण तान्त्रिक ज्ञान नसले तरी तू मान्डलेल्या समस्या येथिल जवळपास प्रत्येकानेच कधीतरी अनुभवल्या असतीलच Happy समस्या नक्कीच समजल्या
उपाय मात्र अवघड आहेत
माझ्या अल्प माहितीनुसार, तू तर युनिकोडचे बोलतोस, चक्क मराठी टाईपराईटरचा कीबोर्ड देखिल समान नसायचा, व जे वेगवेगळे फॉण्ट्स उपलब्ध झाले त्यान्च्या कीबोर्डमधिल असामानतेपासूनच ही सुरुवात झाली आहे.
अन मूळात प्रमाणीकरणाची जबाबदारी (आग्रहासहित सर्व अर्थाने) ही सम्पुर्णतया "कायदे बनविणार्‍या" सरकारची असूनही एकन्दरीतच मराठी भाषा/लिपी याबाबतची सरकारची गेल्या काही दशकातली पराकोटीची अनास्थाही यास प्रत्यक्ष वा अप्रत्यक्ष कारणीभूत असावी असे मला वाटते.
असो
चान्गला महत्वपूर्ण विषय मान्डला आहेस Happy
अजय यान्चे उत्तरही मस्त

किरण, श्रुती आंणि मश्रुम या दोन्ही शब्दात श्र हवा, (आता या पोस्ट मधे नीट दिसतोय.) कधी कधी तो श ला अर्धा र जोडल्यासारखा दिसतो !!!
आमच्या लहानपणी. मराठीतला ल आणि हिंदीतला ल वेगळा असायचा. ,मराठीतला (लसणीतला) ल फारच गोड दिसायला. पण तो आता लुप्त झाला.

अजयकाका, अहो कित्तीवेळा एडीट कर्ताय? Wink
(नन्तर कधीही एडिट केलेल ट्रॅक मोड प्रमाणे वेगळ्या रन्गात दिसायला हव, म्हणजे नेमका तेवढाच नविन भाग वाचला जाईल, माबोवरील सुधारणात ही सूचना टाकावी का?)

ल फारच गोड दिसायला. पण तो आता लुप्त झाला. >>> मला अजुन तोच "ल" लिहिता येतो, नविन प्रचलित "ल" मला लिहिताच येत नाही.

मला यातलं काही समजत नाही; तरीसुद्धा लुडबुड करतोय. मला तरी इथला मा.बो. वरील मराठी लेखनाचा प्रकार आवडतो. समजायला सोपा आणि सहज आहे. अर्थात काही शब्द कधी कधी अडचणीचे होतात; पण त्यात सुधारणा होईलच! Happy

आपल्या म्हणण्यात तथ्य आहेच.
मी मागे राज्य मराठी विकास संस्था यांचे संस्थळ पाहत होतो तेथे
अशी सूचना आहे की,

"मराठी भाषा समाजाच्या तळापर्यंत रुजून सुदृढ व्हावी आणि सर्वांगाने बहरावी यासाठी आपले या संदर्भातील विचार,मते, सूचना आम्हाला जरूर कळवा. आपल्यातील सुसंवादातून मराठीच्या विकासाला गती मिळेल."
दुवा:
http://rmvs.maharashtra.gov.in/rmvs/

मराठी भाषेविषयी तुम्हाला काही सूचवण्या द्यायच्या असतील तर त्या येथे द्या - कारण ही संस्था युनिकोड मराठीच्या प्रमाणिकरणात केंद्र सरकारला (TDIL?)सल्ला आणि इतर संस्थांसोबत योगदानही देते.

-निनाद

किरण तो प्रॉब्लेम OS चाच होता. मी आयफोनच्या पहिल्या अडिच वर्षांबद्दल बोलत होतो. नंतर योग्य ते बद्ल अ‍ॅपलने केले आहेत.

अजय पोस्ट आवडले. तंत्रशुद्ध आहे.

UTF8 हे आस्कि जसेच्या तसे उतरवते, पण काही भाषा जसे लॅटिन किंवा आपली संस्कृत, ज्या भाषेशिवाय काही कॅरॅक्टर्सचा वापर (तुमचे C # चे उदाहरण) हे तसेच्या तसे निट उतरत नाहीत, ह्यावर मात्र काम व्हायला पाहिजे असे वाटते.

त्यामुळे भाषा तशीच्या तशी संगणकावर यायलाच हवी असे नाही. >> ह्याबद्दल मात्र मी थोडा असहमत आहे, कारण पुढे संगणकिय भाषा हीच प्रमाण होईल. जसे मधल्याकाळात प्रिंट करताना अनुस्वार देता येत नसे तर अनेक शब्दातुन अनुस्वार गायब झाला, व तिच आजची प्रमाण भाषा झाली. हे टाळायचे असेल तर एकतर स्वंयसेवकांनी किंवा पैसे देऊन ह्या सोयी ( एक्स्टेंशन पॅकेज मध्ये) करुन घ्यायला हव्यात असे वाटते.

युनिकोडशी संबंधित सर्व आक्षेप एकाच जागी मांडले गेले हे या लेखाचे यश आहे असे मला वाटते. माझ्या द्दष्टीने त्याचे काही कंगोरे मांडतो, ते असे आहेत.

>> एकसमान व प्रमाणित पद्धत
एकसमान पद्धतीला माझा पूर्ण विरोध आहे. फोनेटिक आणि इन्स्क्रिप्ट या दोन पद्धती आहेत. ज्यांना इंग्रजी टंकलेखन येते त्यांच्यासाठी फोनेटिक तर नव्याने संगणक शिकणार्‍यांसाठी इन्स्क्रिप्ट असे दोन पर्याय अत्यावश्यक आहेत. अर्थात फोनेटिक पद्धतीत कोणी पाय मोडके अक्षर लिहून मग त्याला स्वर लावतात तर काही पूर्ण अक्षर लिहून मग आवश्यकतेप्रमाणे स्वर जोडतात. यात कोणी प्रमाणित पद्धत शोधून काढली आणि ती सर्वांनी मान्य केली तर चांगलेच होईल, पण अप्रमाणित पद्धतीतही फार मोठा दोष आहे असे वाटत नाही.
_____

>> सर्व आघाडीच्या संगणक प्रणाली (ऑपरेटींग सिस्टमस्) मध्ये मान्यता. (विंडोज, लिनक्स, मॅक)
विंडोज ही प्रणाली कधीही खर्‍या अर्थाने युनिकोडमान्य होणार नाही. विंडोजमधील विविध प्रोग्राम्स असेच क्रॅश होत राहाणार. अर्थात हे माझे वैयक्तिक मत असून ते पूर्ण चुकीचे असू शकते. इंग्रजी व्यतिरिक्त इतर भाषेत खरोखरच काही काम करायचे असेल तर लिनक्सला पर्याय नाही. अर्थात मायबोलीवर प्रतिसाद कुठूनही देता येतात व येतीलही. मी म्हणतोय ते डी.टी.पी. व इतर कामांबाबत.
_____

>> अर्धा र Apple मधल्या A च्या उच्चाराचे मराठी अक्षर, सर्व काना, मात्रा, विशेषतः र् हस्व वेलांटी ह्यात अनेक दृष्टीआड करता न येण्यासारख्या त्रूटी आहेत.
सध्या या त्रुटींबरोबर जुळवून घ्यावे लागेल असे दिसते.
_____

>> ह्याशिवाय इतर अनेक अक्षरे युनिकोडच्या अनुक्रमात अक्षरशः घुसडलेली आहेत जी देवनागरीत कधीही अस्तित्वात नव्हती (उदा. ऒ ऍ ऎ ॊ ॆ). ह्याला इतर भारतीय भाषांशी अनुरुपता असे नाव दिले आहे, मात्र वास्तवात ती शोभेचीच ठरावीत. वास्तविक हे ISCII ने केलेले Work Around होते मात्र ते युनिकोड मधे तसेच अकारण आले आहे.

या अक्षरांनी मराठीचे मोठेच नुकसान करून ठेवले आहे. ओ आणि ऒ दिसायला सारखे असले तरी पूर्ण वेगळे आहेत. याचबरोबर झिरो विड्थ स्पेस नावाचा एक भारी प्रकार युनिकोडमध्ये आहे. तो कुठेही कसाही वापरता येतो व त्याने सकृतदर्शनी विशेष फरक पडत नसला तरी अक्षरांची संख्या एकाने वाढते व क्रमवारीत तो शब्द अकारण वेगळा दिसतो. नुक्ता हा प्रकार मराठीत नाही, पण इतर भाषांमध्ये असल्यामुळे तो मराठीतही घुसखोरी करतो. मात्र हा युनिकोडचा दोष नसून आय.एम.ई (इनपुट मेथडचा) दोष मानला पाहिजे.
_____

>> आपली लिपी प्रत्येकाला अनेक पर्याय बहाल करते. उदा. अश्व हा शब्द आपण अ, श् व असाही लिहू शकतो. मात्र युनिकोड मध्ये ते जोडाक्षर कसे दिसावे हे फॉण्ट मधले टेबल व रेंडरींग ईंजिन ठरवत असल्याने लेखकाला ती निवड करता येत नाही. सर्व जोडाक्षरांसाठी हाच नियम लागू होतो.

अश्व हा शब्द अर्धा श आणि पूर्ण व असाही लिहीता येतो. हे मान्य. पण नवीन शासकीय धोरणाप्रमाणे जोडाक्षरांची उभी मांडणी करणे अपेक्षित आहे. तेंव्हा पहिला अश्व मान्य करावा हे उत्तम. हा मुद्दा आपण युनिकोडवरील चर्चेत अनवधानाने आणला आहे असे मी मानतो, कारण जोडाक्षरांची मांडणी उभी करावी की आडवी या भानगडीत युनिकोड पडत नाही. आपणच म्हटल्याप्रमाणे ते रेंडरिंग इंजिन ठरवते.
_____

>> म्हणजेच जर मला मुद्दाम होउन अ ला २ काने द्यायचे असतील तर ते युनिकोड आधारित सध्याच्या प्रणालीमध्ये ते शक्य नाही.
अ ला २ काने देणे सध्याच्या प्रणालीत शक्य नाही यासाठी मी अक्षरशः देवाचे आभार मानतो. आधीच कै च्या कै लिहून वाचकांना भोवळ आणणार्‍या टिकोजीरावांना जर ते स्वातंत्र दिले तर उरल्या सुरल्या चिंध्या देखील मराठीच्या अंगावर राहणार नाहीत.
_____

>> ह्या उणीवेमुळे, देवनागरीच्या उपयोगावर निष्कारण प्रतिबंध येतो. उदाहरणार्थ, संगीतातली नोटेशन्स लिहायला देवनागरीत एक विशीष्ट पद्धत वापरतात (भातखंडे लिपी?). ती युनिकोडमध्ये लिहीता येत नाही.
काय राव? बोट दिले तर हात पकडताय? युनिकोड जागतिक भाषांसाठी आहे. भातखंडे लिपीतील संगीताच्या नोटेशन्स लिहिण्यासाठी नाही. (पण कल्पना म्हणून चांगली आहे!)
_____

अजय यांनी एक महत्त्वाचा मुद्दा मांडला आहे.
२ a. हा युनिकोडचा दोष नाही. युनिकोडच्या एका जुन्या आवृत्तीत अर्धा र (र्‍) नव्हता. TDIL ने त्याबद्दल पाठपुरावा करून तो नवीन आवृत्तीत आणला (२००४ मधे).

युनिकोडच्या जुन्या आव्रुत्तीत अर्धा र नव्हता. याचा अर्थ युनिकोड मानक किती गंभीरतेने बनवले गेले होते याचीच शंका वाटते. मराठीत अर्धचंद्राकृती अर्धा र अगदी ठायी ठायी येतो आणि तोच युनिकोडमध्ये नव्हता आणि अजुनही त्याचे स्वतंत्र स्थान नाही यासारखी लांछनास्पद गोष्ट दुसरी नसेल. हिंदीत तसला र नाही म्हणून मराठीलाही मिळू द्यायचा नाही ही कोतेपणाची दृष्टी तेव्हाच्या लोकांनी दाखवली असे एकतर म्हणता येईल किंवा त्यांना मराठी येत नव्हती असे म्हणत त्यांची बाजू घेता येईल. पण याबाबतीत युनिकोडने मराठीला सपशेल तोंडघशी पाडले आहे असे मला वाटते. युनिकोडचे जवळ जवळ प्रत्येक गोष्टीत समर्थन करीत असलो तरी या एका बाबतीत मला कशाही प्रकारे समर्थन करता येत नाही, करावेसे वाटतही नाही. मागे झालेली ही चर्चा पाहा...

http://mr.upakram.org/node/1845

हा असा अर्धा र फक्त य आणि ह लाच जोडला जातो. म्हणजे खोर्‍यात व वर्‍हाडात जसा येतो तसा.
'र्‍य' आणि 'र्‍ह' या जोडाक्षरांना युनिकोडमध्ये मुळाक्षरांसारखे स्थान दिले असते तर हा प्रश्नच आला नसता, अजुनही सुटू शकतो. यासाठी 'झालाच पाहिजे' असे म्हणत कोणी आंदोलन करणार असेल तर माझा पूर्ण पाठिंबा Happy
_____
दिनेशदा लिहितात...
>> आमच्या लहानपणी. मराठीतला ल आणि हिंदीतला ल वेगळा असायचा. ,मराठीतला (लसणीतला) ल फारच गोड दिसायला. पण तो आता लुप्त झाला.
आमच्या लहानप्नी पन खुप सार्‍या गोड गोड गोश्टी होत्या त्या आता नाही शा झाल्या. किती दिवस आठवण काडत जगणार? मूव्ह ऑन. शेंडीवाला श देखील असाच खूप लोकांना नॉस्टॅल्जिक करतो. पण आता लंगडा ल आणि टकलू श बरोबर संसार निभावून न्यायचा आहे असा निश्चय करा म्हणजे वाईट वाटणार नाही. लसणीतला ल आणि शेंडीवाला श रेंडरिंग इंजिन किंवा विशिष्ट फॉन्ट वापरून बदलता येतो हे खरे, पण शेकडा ९९% लोक्स ते करणार नाहीत हे नक्की.

खूप छान प्रतिसाद येत आहेत त्याबद्दल धन्यवाद.
सध्या मी वेळेअभावी त्रोटक प्रतिसाद देतोय.
अजय, मला वाटते मी माझ्या पोष्ट मध्ये अगदी सुरुवातीलाच म्हटल्याप्रमाणे इथे युनिकोड म्हणजे फक्त युनिकोड कंझॉर्टियम नव्हे तर तो बेस वापरुन आपल्यापर्यन्त मराठी दाखवणार्‍या सर्व प्रणाली अंतर्भूत आहेत.
आणि इथे कोणालाही दोष देण्याचा हेतू नाहीये. युनिकोडचा आवाकाच एवढा मोठा आहे की त्यादृष्टीने देवनागरी अक्षरशः खिजगणतीत येते. संख्येतच बोलायचे झाले तर युनिकोड मध्ये सर्व भाषा (लिपी) धरल्या तर ६४००० गुणिले १७ इतकी अक्षरे प्रमाणीकृत करता येतात. त्यातील देव्नागरीच्या वाट्याला १२८ + ३२ इतके सांकेतांक आले आहेत. तसेच त्याच्या प्रमाणीकरणाचे कामसुद्धा युनिकोड चे नव्हते शिवाय जिथे आपल्याच भाषातज्ञांचे एकमत होत नाही तिथे ईंटरनॅशनल नॉन प्रोफिट ऑर्गनायझेशन कडून ही अपेक्षा करता येणार नाहीच. युनिकोड्चे काम अतिप्रचंड शब्द वर्णन करायला कमी पडावा इतके आहे पण ते स्वयंपूर्ण नाही.

ह्या लेखाचा उल्लेख मी म्हटल्याप्रमाणे युनिकोड आधारित सध्या अस्तित्वात असलेल्या 'सोल्यूशन' वर आहे.

वर वर्णन केलेले काही मुद्द्यांबाबत युनिकोड जबाबदार नाही हे जरी कळले तरी होणारा त्रास टळत नाही.

मात्र सर्वप्रथम आपण सर्वजण थोडे वादातीत असे technical मुद्दे समजून घेतले तर त्याप्रमाणे यावर उपाय योजता येतील.

युनिकोड मधले प्रोब्लेम्स खालील पातळीवर मांडता / सोडवता येतील.

१. भाषाविरहित : केवळ १ बाईट = १ अक्षर ही संकल्पना मोडीत निघाल्यामुळे होणारे, UTF-8, UTF-16, UCS-2 इत्यादी एन्कोडींगमुळे होणारे
२. भारतीय भाषांच्या पातळीवरचे
३. भारतीय देवनागरी लिपी वापरणार्‍या भाषांच्या पातळीवरचे (हिंदी, संस्कृत, मराठी, कोकणी, सिंधी, इ) - सध्याच देवनागरी चार्ट च्या पातळीवरचे.
४. फक्त मराठीबद्दलचे.
५. इतर उपप्रणाल्यांवर सोपवलेल्या जबाबदार्‍या व त्याचे न झालेले पालन ह्याबद्दल.
६. युनिकोडच्या पॉलिसी संदर्भात - एकदा झालेले प्रमाणीकरण (Code point assignment) तसेच ठेवण्याबद्दल (चुकीचे असले तरी). [ही पॉलिसी Backward Compatibility साठी योग्य असली तरी नवीन प्रणाल्यांत संभ्रम निर्माण करणारी आहे. जसे अर्धा र लिहिण्याच्या २ पद्धती]

त्रोटक म्हणूनसुद्धा प्रतिसाद लांबलचकच झाला!
शन्तनुओ: अतिशय उत्तम प्रतिक्रिया अर्थात काही गोष्टींबद्दल असहमत त्यातलीच ही एक

>>>>>>>>>>>>>>>>>>
अ ला २ काने देणे सध्याच्या प्रणालीत शक्य नाही यासाठी मी अक्षरशः देवाचे आभार मानतो. आधीच कै च्या कै लिहून वाचकांना भोवळ आणणार्‍या टिकोजीरावांना जर ते स्वातंत्र दिले तर उरल्या सुरल्या चिंध्या देखील मराठीच्या अंगावर राहणार नाहीत.
>>>>>>>>>>>>>>>>>>

इंग्लिशमध्ये का हो असे होत नाही? तिथेही आपण invalid spellings लिहु शकतोच ना? इंग्लिशमध्येसुद्धा spell checker ASCII मानकापासून अस्तित्वात नव्हते मात्र कीबोर्डचे प्रमाणीकरण लगेच झाल्यामुळे ज्यांना बरोबर स्पेलींग माहित होते त्यांना बरोबर लिहीण्यासाठी काहीही त्रास पडला नाही.

एकसमान पद्धत असण्याचा हा एक महत्वाचा फायदा आहे की मी उद्या विचारले की मला ऋषीतला ऋ लिहायचा आहे तर कसा लिहू ह्याचे उत्तर तो मी कुठली सिस्टीम वापरुन लिहीत आहे ह्यावर अवलंबून असता कामा नये.

मुळात कोणत्याही लिपीचा उपयोग फक्त भाषेपुरताच मर्यादित ठेवणे हेच मला आक्षेपार्ह वाटते. तसे असते तर रोमन अक्षरांचा उपयोग करुन काढलेली चित्रे, आपल्या रोजच्या वापरातील स्मायली इत्यादी अनेक उपयोग अस्तित्वात आले नसते.

पण अगदी लिपीच्याच संदर्भात हा मुद्दा पटवून द्यायचा असेल तर जुन्या (खरेतर फार जुन्या नव्हे, अगदी २० वर्षांपुर्वी मी देखील हे वापरलेले आहे) मराठीत खालील शब्दांसाठी हे "शॉर्ट्फॉर्म होते". कदाचित काही जणांना हे माहित असतील / नसतील

साहेब = सा ला अजुन एक काना व मात्रा
तालुका जिल्हा = ता ला अजुन एक काना व मात्रा

शेवटी काय ठेवायचे व काय राहू द्यायचे हे तत्कालीन लोकच ठरवत असतात. आणि ह्यात मतमतांतरे असणेही तितकेच साहजिक आहे.

आता प्रसिद्ध झालेला शासन निर्णय बर्‍याच विचारांती झालेला आहे असे वाटते. त्यात बर्‍याच गोष्टी कळतात. कोनाकडे त्याची लिन्क असल्यास जरुर द्यावी. अक्षरशः मला स्वतःला माहित नसलेली बरीच माहिती त्यात कळली. मी तर चक्क त्याचे प्रिण्ट काढून आणले आहे!

आपण वर्णमाला हा शब्द खूप भोंगळपणे (असे वा! सुचला काहीतरी शब्द - लू़जली लिहायचे नव्हते) वापरतो पण त्यात त्याचे अचूक वर्णन केलेले आहे.

माझी अशी अपेक्षा आहे की युनिकोडमधील कोडचार्ट्ची पुनर्र्चना करुन ह्यात दर्शवलेल्या वर्णमालेप्रमाणे करावी ज्यात "व्यंजनवर्णांना" सांकेतांक (code points) दिलेले असावेत आणि त्यात स्वर मिसळला की त्याचे "अक्षर" बनावे. (सध्याच्या काही इन्पुट मेथड त्याचा आभास तयार करतात मात्र युनिकोडची संरचना तशी नाही)

खुप छान माहिती ! धन्यवाद शेअर केल्याबद्दल ! काही तपशील कळले नाहीत समजावून घ्यायला आवडेल. प्रयत्न करतेय Happy
आणखीन एक शंका आहे मराठीत क्+ त = क्त असे येते. बर्‍याच ठिकाणी हा दोष राहतो वरच्या लेखातही हे दिसेल >>>युनिकोड देवनागरी तक्ता ह्या दोन्ही अक्षरांना जोडाक्षरे मानतो.<<< प्रत्यक्षात ते असे हवे ना...tk_1.jpg
यावर काही करता येईल ? किमान माबोवर ?
ऑफलाईन असताना मराठी टाईप करण्यासाठी माबोच्या जवळ जाणारी कोणती प्रणाली आहे हे कृपया सांगाल का? पुन्हा एकदा धन्यवाद Happy

आरती, स्वाती म्हणतेय ते बरोबर आहे, तसेच 'पत्कर' मधला 'त्क' लिहीण्याची एकच पद्धत आहे.
मा़झ्या मूळ लेखात ६a मध्ये मी हाच मुद्दा मांडला आहे की आपल्याला पाहिजे तसे लिहीण्याचे स्वातंत्र्य नाही. ह्याचे कारण युनिकोडच्या मूळ तक्त्यात (अरे वा! गम्मतच आता क्त य जोडल्याने वेगळा आलेला आहे त्याचा स्वीकार करावा :)) अर्धा क साठी कोणताही प्रमाणित सांकेतांक नाही. ती फॉण्ट, रेंडरींग ईंजिन, आणि अ‍ॅप्लिकेशन (म्हणजे ह्या उदाहरणात ब्रॉऊजर) यांनी केलेली योजना आहे.

लेख आणि सगळ्या प्रतिक्रिया वाचल्या.
किरण, लेखाबद्दल धन्यवाद. आणि निनाद, अजय, शंतनु तुमच्या प्रतिक्रियांबद्दल धन्यवाद. यातून चांगली माहिती मिळतेय.

माझे काही प्रश्न -
( बाळबोध असू शकतात . Happy )
फॉण्ट निर्मितीची प्रक्रिया नेमकी काय असते?
एखाद्या लिपीला युनिकोडमध्ये स्थान मिळवण्यासाठी काय करावे लागते?
त्यात पुन्हा बदल करायचे असतील तर काय करावे लागते? बदलाला कोणाची मान्यता असायला लागते. यात मदत करायची इच्छा असल्यास कोणाच्या संपर्कात राहिले पाहिजे?
एकाच लिपीचे वेगवेगळे फॉण्ट युनिकोडमध्ये असू शकतात का? (वर तुम्ही ६४००० गुणिले १७ असा हिशेब दिला आहे. म्हणजे प्रत्येक लिपीच्या / भाषेच्या वाट्याला मर्यादित युनिकोड येत असतील ना?)

>>>आरती२१, 'क्त' (तक्ता, रक्त) असंही लिहिण्याची पद्धत आहे. <<< नाही. त्याचा उच्चार त्क असा होतो. म्हणूनच वर मी त्क आणि क्त हे कसे सारखेच आहेत हे फोटोशॉपमध्ये आपण लिहितो तसं लिहून फरक दाखवायचा प्रयत्न केला होता. कोणतेही जोडाक्षर लिहिताना प्रथम ज्याचा उच्चार आहे त्याचेच चिन्ह आधी दिसायला हवे.
>>>मूळ तक्त्यात (अरे वा! गम्मतच आता क्त य जोडल्याने वेगळा आलेला आहे त्याचा स्वीकार करावा<<< किरण मला हेच म्हणायचे आहे. य लागल्यावर क उच्चारानुसार पहिल्यांदा आला तसाच नुसते तक्ता लिहितानाही क च पहिल्यांदा यायला हवा Happy
आम्ही टिमवित पुस्तकं छापताना अनेक प्रकाशकांना समजाऊन, प्रसंगी भांडून हा बदल करायला लावला होता, अन मग त्यांनी तो केलाही होता. नंतर त्यातल्या काहींशी मैत्री झाल्यावर त्यांनी अक्षर जुळणी करणार्‍या अशिक्षित लोकांना यातला फरक कळतच नव्हता हे सांगितले, ( हे शब्दशः खरे आहे , इथे कोणावरही टिका करण्याचा खरोखर हेतू नाही, तेव्हा हलके घ्या Happy )

आरतीचे उदाहरण मला पटते
त्यासच अनुसरुन किरणचे मुद्दा "आपल्याला पाहिजे तसे लिहीण्याचे स्वातंत्र्य नाही."" हा देखिल पटतो
आता यावर उपाय काय?

Pages