युनिकोड देवनागरी – किती कमावले, किती गमावले.

Submitted by किरण on 10 June, 2010 - 14:59

(विशेष सूचनाः खालील लेखात जिथे जिथे युनिकोड असा उल्लेख आहे तिथे संदर्भाप्रमाणे युनिकोड आधारित सध्याच्या सर्व उपप्रणाल्या अंतर्भूत आहेत. फक्त युनिकोड कंझॉर्टियम नव्हे. ह्या उपप्रणाल्या म्हणजे Input Method Editor (IME)/Keyboard, Unicode encoding, serialization, storage, retrieval systems, operating systems, rendering engine, support for Complex scripting, fonts, uniscribe or equivalent for character sequencing, display systems and end user applications)

एकीकडे युनिकोडमुळेच मराठी संगणकयुगात वावरु शकते ह्याचा अभिमान असताना युनिकोड देवनागरीच्या प्रमाणीकरण करताना झालेल्या घोडचुकांमुळे मराठी लिपी (देवनागरी) चे सौंदर्य, वैशिष्ट्ये व विविधता ह्या सर्वांना धोका निर्माण झाला आहे.

हे गौडबंगाल अनेक तंत्रज्ञांना अजून कळले नाहीये तर सामान्य जणांना विचारतोच कोण!

हा विषय खूपच व्यापक आणि क्लिष्ट आहे आणि त्यामुळे बरेच लोक ते समजून घ्यायच्या भानगडीत सुद्धा पडत नाहीत.. शिवाय ह्यातील सर्वसमावेशक असे विवेचन लिहायला गेल्यास एक ग्रंथ लिहीता येइल.

बऱ्याच लोकांना हा लेख कशासाठी लिहीला आहे असाही प्रश्न पडण्याची शक्यता आहे. पण इथे येणारे बरेच लोक हे संगणक कुटण्याची कामे करतात त्यामुळे लोकांची ह्याबाबत नेमकी मते काय आहेत, तसेच ज्यांना ह्याबद्दल उत्सुकता आहे पण जाणून घ्यायला जमले नाही त्यांना थोडेफार आकलन व्हावे मग किती जणांना हा खरोखर प्रॉब्लेम वाटतो का? व वाटलाच तर तो कसा सोडवता येइल ह्याबाबत मला जाणून घ्यायचे आहे.

हा विषय इथे शास्त्रशुद्ध पद्धतीने मांडावा असे बरेच दिवस मनात होते, पण वेळेअभावी व येथे रोजच येणे शक्य नसल्याने पुढे ढकलत होतो. युनिकोडला १७ वर्षे आणि युनिकोड देवनागरी येउन १३ वर्षे लोटूनसुद्धा (माझ्या !) मनायोग्य असे प्रमाणीकरण झालेले नाही व नजीकच्या भविष्यात तसे होण्याची चिह्नेही दिसत नाहीत.. केवळ काही अक्षरांना क्रमांक दिले म्हणजे प्रमाणीकरण असे ज्यांचे म्हणणे असेल तर ते झालेले आहे पण निर्दोष वापरण्याच्या दृष्टीने त्याचा उपयोग मर्यादितच राहिला आहे. ह्यामध्ये इतर प्रणाल्यांवर जी जबाबदारी सोपविण्यात आली आहे त्यामुळे हा प्रश्न व त्याची उत्तरे खूपच गुंतागुंतीची झाली आहेत.

सर्वसामान्य माणसाच्या अपेक्षा फारच थोड्या – म्हणजे मराठीत दिसणे, अचूकपणे लिहीता येणे, इमेल पाठवता येणे व पलीकडील संगणकावर ‘तसेच्या तसे’ दिसणे – इतक्या माफक असून त्यादेखील अजून पूर्णपणे साध्य झालेल्या नाहीत. (इथे प्रौढी मिरवायचा हेतू नव्हे, पण ज्या १० वर्षांपूर्वीच किरण फॉण्टने सोप्या पद्धतीने करुन दाखवल्या होत्या)

वास्तविक पहाता प्रमाणीकरणाकडून ह्यापेक्षा खूप जास्त अपेक्षा आहेत

प्रमाणीकरणाकडून अपेक्षा व युनिकोडने पूर्ण न होउ शकलेल्या सध्याच्या समस्या

१. टाइप करण्यासाठी सोपी, एकसमान व प्रमाणित पद्धत. ह्यातील प्रत्येक गरज अत्यंत महत्वाची आहे.

a. जवळजवळ प्रत्येक मराठी साईटवर युनिकोड टाईप करण्यासाठी वेगवेगळया पद्धती आहेत.

b. शिवाय Online / Offline IME, Keyboard Overlays, Transliterators programs (‘मिन्गलिश’ मध्ये लिहिलेले देवनागरीत बदलणारे) असे असंख्य प्रकार आहेत.

c. मुख्य म्हणजे ह्यातल्या एकाही पद्धतीत सर्वच्या सर्व मराठी भाषेतील देवनागरी अक्षरे जशी यायला हवीत तशी लिहीता येतीलच असे ठामपणे म्हणता येत नाही. ह्यातील काही कारणे त्या पद्धतीत असली तरी काही कारणे युनिकोडच्या सदोष एनकोडींगवर तर काही विविक्षीत फॉण्ट तर काही Operating Systems वर आधारित आहेत.

d. Minglish आधारित पद्धत मला तत्वतः अजिबात मान्य नाही. जरी त्यात कामचलाऊ मराठी लिहीता येत असले तरी बोजड संस्कृत मधील श्लोक लिहायला गेल्यास अवघड जागेचे दुखणे होऊन बसते!

२. सर्व आघाडीच्या संगणक प्रणाली (ऑपरेटींग सिस्टमस्) मध्ये मान्यता. (विंडोज, लिनक्स, मॅक)

a. युनिकोडमध्ये टाईप केलेला मजकूर सर्व प्रणालीत जसाच्या तसा दिसत नाही. अर्धा र Apple मधल्या A च्या उच्चाराचे मराठी अक्षर, सर्व काना, मात्रा, विशेषतः र् हस्व वेलांटी ह्यात अनेक दृष्टीआड करता न येण्यासारख्या त्रूटी आहेत.

३. सर्व संगणक कार्यक्रमात (प्रोग्रॅम्स) समान आचरण – मजकुराची प्रत एका कार्यक्रमातून दुसरीकडे नेल्यास अक्षरांची फेरफार न होणे.

a. उदा. Microsoft Word मध्ये युनिकोडमधला केवळ ‘काना’ टाइप करता येत नाही. त्याअगोदर एखादे अक्षर असणे आवश्यक असते. मात्र हीच गोष्ट नोटपॅडमधे शक्य आहे! तसेच Word मधेच Insert Symbol वापरुन थेट युनिकोड Enter केल्यास ते करता येते. असे का? ह्याचे उत्तर मला तरी मिळालेले नाही.

b. अनेक प्रोग्रॅम्स अजूनही युनिकोड पूर्णपणे सपोर्ट करत नाहीत. अनेक प्रोग्रॅम्स एकतर Unexpected character strings मुळे क्रॅश होतात अथवा अपेक्षेप्रमाणे चालत नाहीत. (ह्यामध्ये ऱ्हस्व वेलांटी अक्षराच्या नंतर दिसणे, अर्धा र बरोबर न दिसणे, जोडाक्षरे व्यवस्थित न दिसणे, ? किंवा चौकोन दिसणे इ प्रकार अंतर्भूत आहेत). अनेक Photo Editor, Image Processing, Animation, Desk Top Publishing चे प्रोग्रॅम्स ह्यात अंतर्भूत आहेत.

४. मराठीतील सर्व मुळाक्षरे व जोडाक्षरे त्यातील लिपीच्या संकेतानुसार लिहीता येणे

a. ह्यात अर्धा र, पहिली वेलांटी, अ अधिक काना म्हणजेच आ, क्ष व ज्ञ ह्यांना (विशेष संयुक्त) मुळाक्षरे म्हणून मान्यता, व्यंजनांच्या अर्धस्वरुपाला व प्रचलित जोडाक्षरांना प्रमाणित स्थान, इ मुद्दे येतात.

५. संगणकाच्या पद्धतीने क्रमित (सॉर्ट) केल्यास वर्णमालेच्या क्रमाने लावता येणे

a. देवनागरी ही लिपी अनेक भाषांसाठी वापरली जात असल्याने आणि प्रत्येक भाषेचा वर्णानुक्रम थोडाफार वेगळा असल्याने हा गोंधळ निर्माण झाला असला तरी सध्याचा युनिकोड मधला क्रम ही कुठल्याच भाषेतील वर्णमाला नाहीए.

b. क्ष ने सुरु होणारे शब्द क व ख च्या मध्ये येतात तर ज्ञ ने सुरु होणारे शब्द चक्क ज व झ च्या मधे येतात! युनिकोड देवनागरी तक्ता ह्या दोन्ही अक्षरांना जोडाक्षरे मानतो.

c. ह्याशिवाय इतर अनेक अक्षरे युनिकोडच्या अनुक्रमात अक्षरशः घुसडलेली आहेत जी देवनागरीत कधीही अस्तित्वात नव्हती (उदा. ऒ ऍ ऎ ॊ ॆ). ह्याला इतर भारतीय भाषांशी अनुरुपता असे नाव दिले आहे, मात्र वास्तवात ती शोभेचीच ठरावीत. वास्तविक हे ISCII ने केलेले Work Around होते मात्र ते युनिकोड मधे तसेच अकारण आले आहे.

६. लिपीची वैविध्यता व शैली लक्षात घेऊन लिहीण्याचे स्वातंत्र्य एकाच टंकात (फॉण्ट) लेखकास बहाल करणे जेणेकरुन लेखक त्याच्या पसंतीनुसार निवड करु शकेल

a. आपली लिपी प्रत्येकाला अनेक पर्याय बहाल करते. उदा. अश्व हा शब्द आपण अ, श् व असाही लिहू शकतो. मात्र युनिकोड मध्ये ते जोडाक्षर कसे दिसावे हे फॉण्ट मधले टेबल व रेंडरींग ईंजिन ठरवत असल्याने लेखकाला ती निवड करता येत नाही. सर्व जोडाक्षरांसाठी हाच नियम लागू होतो.

७. मुख्य म्हणजे देवनागरी ही बोलीभाषा नसून लिपी असल्याने निर्माण केलेले प्रमाण छपाई व प्रदर्शन (डिस्प्ले) ह्यांना सर्वप्रथम प्राधान्य देऊन केलेले असावे.

a. मुळातच लिहीण्याच्या शैलीवर कोणताही प्रतिबंध मला स्वतःला अमान्य आहे. Roman अक्षरे लिहीताना जर एखादे चुकीचे स्पेलींग लिहीले तर कोणताही एडीटर त्यास अटकाव करत नाही. स्पेल चेकर त्यातील चूक दाखवून देऊ शकतो, पण ती मान्य / अमान्य करणे लेखकाच्या हातात ®®असते. मात्र युनिकोड देवनागरीसाठी ह्याचे स्वातंत्र्य नाही.

b. म्हणजेच जर मला मुद्दाम होउन अ ला २ काने द्यायचे असतील तर ते युनिकोड आधारित सध्याच्या प्रणालीमध्ये ते शक्य नाही.

c. ह्या उणीवेमुळे, देवनागरीच्या उपयोगावर निष्कारण प्रतिबंध येतो. उदाहरणार्थ, संगीतातली नोटेशन्स लिहायला देवनागरीत एक विशीष्ट पद्धत वापरतात (भातखंडे लिपी?). ती युनिकोडमध्ये लिहीता येत नाही.

८. टंकीत केलेला मजकूर कोणालाही कुठल्याही प्रणालीवर संपादित करुन इतर भागास धक्का न पोचता पाठवता यावा.

a. आधी सांगितल्याप्रमाणे युनिकोड देवनागरीमधल्या मजकूरातील काही अक्षरे किंवा जोडाक्षरे विविध प्रणालींवरती वेगवेगळा दिसतो त्यामुळे एका पणालीमध्ये केलेली दुरुस्ती पुन्हा दुसऱ्या प्रणालीत चुकीची दिसते

ह्याचा एकत्रित परीणाम हा झाला आहे की ज्यांना शुद्ध मराठी येते त्यांनादेखील एखादे अक्षर संगणकावर कसे लिहावे ते माहित नसल्याने अशुद्ध लिहीले जाते आणि अनेक संकेतस्थळांवर असे अशुद्ध मराठी कायमस्वरुपी जतन केले जात आहे.

अर्थात मग युनिकोड एकदमच टाकाऊ आहे का? तर नाही. युनिकोडमुळे देवनागरीला non-sharable असे स्थान मिळाले आहे. Microsoft, Apple, Google, Adobe अशा बड्या धेंडांच्या Sub-system Implementation सपोर्ट मिळाल्यामुळे आजच्या काही ब्रोऊजर्स मध्ये तरी देवनागरी दिसू शकते. इमेल वेगवेगळ्या सर्व्हर्समधून जात असल्याने आणि त्यातल्या एकाही दुव्यात युनिकोड Encoding Compatibility नसेल तर पलिकडील संगणकावर बरोबर दिसेल ह्याची खात्री देता येत नाही. पण याहू, जीमेल अशा वेब बेस्ड सिसटीम्स मधे बऱ्यापैकी कम्पॅटिबिलिटी आहे.

सर्वसाधारणपणे असे म्हणता येइल की वेब बेस्ड सिस्टीम्स ह्या बऱ्यापैकी अद्ययावत असल्याने त्यांनी युनिकोड अनुरुपतेत बऱ्यापैकी बाजी मारली आहे. मात्र अशी Softwares ज्यांना Internationalization करुन कोणताच जास्त आर्थिक फायदा नाही त्यांनी युनिकोडशी अनुरुपता करण्याचे टाळले आहे किंवा तो त्यांचा प्राधान्यक्रम नाही. एखादा प्रोग्रॅम युनिकोड अनुरुप करणे ही साधीसुधी गोष्ट नाहीए, त्यासाठी आमूलाग्र बदल आवश्यक असतो, इतका की कधी कधी त्यापेक्षा तो पुनर्निर्मित करणे सोपे पडावे. ह्याविषयी पुन्हा केव्हातरी.

पण हेही एक कारण आहे की ज्यामुळे सर्व प्रोग्रॅम्स आजही युनिकोडशी अनुरुप नाहीत आणि ते होण्याची शक्यताही नाही. असो.

काही महत्वाच्या पोष्ट्स व त्याची उत्तरे

किरण | 12 June, 2010 - 21:26

सर्वांच्या प्रतिसादासाठी पुन्हा एकदा धन्यवाद. तसेच सर्वांना वेळेअभावी उत्तर देता येत नसले तरी जमेल तसे वाचत आहे. त्यामुळे एखाद्या प्रश्नाला उत्तर द्यायचे राहून गेले असेल तर मला विपूत लिहावे. जसे जमेल तसे मी लिहीन. कोणाचाही अनुल्लेख करायचा हेतू नाही आणि कोणतीही शंका अयोग्य नाही.

गजाननः तुमचे प्रश्नही योग्य आहेत. आणि त्यात बाळबोध असे काहीही नाहीत. मलादेखील कधीना कधी ते पडलेच होते आणि अजूनही सर्वांची योग्य उत्तरे माहित आहेतच असेही नाही. किम्बहुना मी अनेकांशी बोलूनदेखील बर्‍याच जणांना अनेक महत्वाच्या गोष्टींची सुद्धा माहितीच नसल्याचे जाणवले.

मी माझ्या मतिप्रमाणे त्याची उत्तरे द्यायचा प्रयत्न करतो.

> फॉण्ट निर्मितीची प्रक्रिया नेमकी काय असते?
उ. फॉण्ट निर्मितीची थोडक्यात प्रक्रिया अशी: (मात्र त्यात युनिकोड आधारित फॉण्ट बनवणे ह्यात अनेक क्लिष्ट गोष्टी आहेत त्याबद्दल मी नन्तर लिहीन. )
फॉण्ट वापरुन आपल्याला जी अक्षरेदिसायला हवीत त्यांचे डिझाईन कागदावर मोठ्या आकारात तयार करणे.
ती स्कॅन करुन विशीष्ट टूल्स वापरून त्यांचे vectorization करणे. देवनागरी फॉण्ट्ससाठी शिरोरेखेचे भान ठेवणे अतिशय आवश्यक असते कारण ती सलग, सारख्या जाडीची आणि एकाच उंचीची दिसणे अतिशय महत्वाचे असते. ही फाईन अ‍ॅड्ज्स्ट्मेण्ट प्रत्येक अक्षरासाठी मॅन्युअली करावी लागते. तसेच प्रत्येक फॉण्ट साईजला सर्व अक्षरे बरोबर दिसतात की नाही, ई अनेक गोष्टी पहाव्या लागतात. नन्तर विवक्षीत टूल्स वापरुन मानकाप्रमाणे अक्षरे योग्य सांकेतांकाना जोडून घेणे. ही ASCII व True Type Font बनवण्याची पद्धत झाली.

मात्र युनिकोड देवनागरीसाठी Open Type Font वापरावा लागतो आणि त्यात अतिशय क्लिष्ट असे Rules scripting करावे लागते. त्याच्या तपशीलात मी सध्या शिरत नाहीये.

> एखाद्या लिपीला युनिकोडमध्ये स्थान मिळवण्यासाठी काय करावे लागते?
उ. युनिकोड कंझॉर्टियम ही एक स्वायत्त संस्था आहे. http://www.unicode.org ह्या दुव्यावर अधिक माहिती मिळु शकेल.
मात्र ह्यात स्थान मिळवण्यासाठी काय करावे लागते त्याचा तपशील मला माहित नाही.

> त्यात पुन्हा बदल करायचे असतील तर काय करावे लागते? बदलाला कोणाची मान्यता असायला लागते. यात मदत करायची इच्छा असल्यास कोणाच्या संपर्कात राहिले पाहिजे?
उ. युनिकोडच्या स्थापना झाल्यावर त्याच्या प्रमोटर्सनी जगातील सर्व writing systems चा सर्वे घेउन काही भाषा निश्चित केल्या तसेच जरी ही नॉन प्रॉफिट ऑर्गनायझेशन असली तरी त्यावर त्याच्या promoters चा खूप प्रभाव आहे. त्यामूळे जरी एखादा बदल सजेस्ट केला तरी तो अमलात यावा अथवा नाही ह्यावरती अंतिम निर्णय जरी त्यांना भाषेबाबत काहीही माहिती नसली तरी तेच घेऊ शकतात. आणि ह्यामुळेच साध्या साध्या गोष्टींसाठी सुद्धा (मराठीतला अर्धा र, बंगालीमधला खण्ड त) खूप पाठपुरावा करावा लागतो असे ऐकून आहे. शिवाय ह्यात कालापव्यय झाल्याने तोपर्यंत इतर प्रणाल्यांमधे त्रुटी राहून जातात आणि नन्तर जरी त्यात बदल झालाच तरी इतर प्रणाल्यांवर जी जबाबदारी सोपविली आहे त्याचे निर्माते वेगवेगळे असल्याने तसेच त्यांना हे बदल अमलात आणायचे कुठलेच बंधन नसल्याने हे बदल आपल्यापर्यंत पोचण्यास अनेक वर्षे जातात. युनिकोड्चे आत्तचे version 5.2 आहे. जवळ जवळ सर्व मेजर व्हर्जन मध्ये देवनागरी अक्षरे त्यात टाकली गेली मात्र युनिकोड आधारित फॉण्ट मधे त्याची अंमल्बजावणी त्या त्वरेने होऊ शकत नाही.

एकाच लिपीचे वेगवेगळे फॉण्ट युनिकोडमध्ये असू शकतात का? (वर तुम्ही ६४००० गुणिले १७ असा हिशेब दिला आहे. म्हणजे प्रत्येक लिपीच्या / भाषेच्या वाट्याला मर्यादित युनिकोड येत असतील ना?)

उ. हो. आणि ते असायलाच हवेत, तरच काहीतरी उपयोगी गोष्ट घडू शकते. मात्र देवनागरी युनिकोड फॉण्ट कसे बनवावेत ह्याबाबत अतिशय कमी माहिती सध्या उपलब्ध आहे. जी आहे ती मी समजून घ्यायचा प्रयत्न केला पण ती जणू काही कोणाला समजू नये अशाच प्रकारे लिहीली असावी असे वाटावे असा संशय यावा अशी परिस्थीती आहे. अर्थात हे माझे स्वतःचे मत आहे. मात्र एक गोष्ट निश्चित की एक युनिकोड देवनागरी फॉण्ट बनवण्यासाठी लागणारे परिश्रम एका माणसाच्या आवाक्याबाहेर आहेत.

इतरांना ह्याबद्दल आणखी माहिती असेल तर कृपया द्यावी.

* संपादन
* प्रतिसाद

किरण | 13 June, 2010 - 00:27

अजय, हा तुझ्या काही इतर मुद्द्यांवरचा रीप्लायः
ज्या मुद्द्यांवरती तुझा रिप्लाय युनिकोडच्या आवाक्याबाहेर आहेत असा आहे, ते मलासुद्धा मान्य आहे, मात्र भारतीय - देवनागरी - मराठी - end user ह्या नात्याने उपलब्ध सोल्यूशन ने अनेक प्रश्न निर्माण केले आहेत.
त्याबद्दल हे सर्व.

>>>
१. तुझे मुद्दे बरोबर असले तरी युनिकोडच्या संदर्भात पटत नाही. मुळात Ascii पद्धत का सुरु झाली? तर वेगवेगळ्या Operating system मधे असलेला Data सहज एका संगणकावरून दुसरीकडे नेता यावा म्हणून. यात डाटा Input कसा करावा हे कुठेच लिहिलेले नाही. उदा. QWERTY पद्धतीची एकच input method असूनही Ascii आणि EBCDIC अशा दोन अंतर्गत पद्धती होत्याच की. त्यामुळे Unicode, फक्त एकदाच Unicode मधे असलेला Data कुठल्याही संगणकावर सारखा कसा वापरता येईल यासाठी तयार केली गेली आहे. IME चे प्रमाणिकी करण आवश्यक हा तुझा मुद्दा योग्य असला तरी युनि़कोडच्या आवाक्याबाहेरचा तो मुद्दा आहे.

रिप्लाय:
EBCDIC ह्या पद्धतीतही असेच अनेक दोष होते जसे की A साठी चा Code + 1, असे केल्यावर B चा कोड यावा इतके साधे logic सुद्धा त्यात नव्हते. म्हणजेच A to Z ला Continous Code Assignment नव्हती, त्यामुळे programmers च्या डोक्याला इतका अनावश्यक त्रास झाला की ती सिस्टीमच रद्दबातल झाली आणि ASCII अस्तित्वात आली.

"Information Interchange" इतके सिमीत objective जरी आपण युनिकोड च्या बाबतीत ठेवले तरी त्या त्या लिपीतील सर्व प्रमाणभूत अक्षरांना प्रमाणित स्थान मिळाले नसल्याने (अर्थात हे माझे मत आणि ह्याबाबत अनेक मतमतांतरे असू शकतात आणि ह्यासंदर्भात पलिकडूल बाजूचे काही मुद्दे देखील मला मान्य आहेत). उदाहरण द्यायचे झाले तर समजा आपण इन्ग्लिश करता प्रमाणीकरण करत आहोत आणि समजा त्यात X, Y, Z ही अक्षरेच घेतली नाहीत. आणि ती न घेतल्यामुळे होणारा घोळ थांबवण्यासाठी असे वर्क अराऊंड काढले की X म्हणजेच A*, Y म्हणजेच B*, Z म्हणजेच C*. अशा प्रकरचे घोळ युनिकोड मध्ये झाले आहेत. शिवाय नंतर पाठपुराव्यामुळे X, Y, Z त्यात घातले गेल्यावर होणारे घोळ तर अवर्णनीय आहेत.
त्यामुळे Backward Compatibility च्या नावाखाली वर्क अराऊंड ही व्हॅलीड ठरते आणि नवीन कोड सुद्धा!
आज अर्धा र लिहायच्या २ पद्धती अस्तित्वात आहेत

१. नुक्ता वाला र, पाय मोडायचे चिह्न
२. नेहमीचा र, पाय मोडायचे चिह्न, ZWJ (Zero Width Joiner)

शिवाय युनिकोड हे म्हणायला मोकळे आहेच की आम्ही थोडेच सांगितले होते की आमच्या वर आधारित सिस्टीम बनवा! आणि ते खरेच आहे. हे आपल्यालाच ठरवायचे आहे की आपण आहेत त्या त्रूटींसकट केवळ ते एकमेव मानक अस्तित्वात आहे म्हणून तसेच चालवून घ्यायचे की एखादे नवीन Open Source Standard वापरायचे?

>>>२ a. हा युनिकोडचा दोष नाही. युनिकोडच्या एका जुन्या आवृत्तीत अर्धा र (र्‍) नव्हता. TDIL ने त्याबद्दल पाठपुरावा करून तो नवीन आवृत्तीत आणला (२००४ मधे). त्याबद्दलची चर्चा अजूनही जालावर उपलब्ध आहे ( http://unicode.org/~emuller/iwg/p8/index.html) पण ती सुधारण झाल्यावर काही फाँट निर्मात्यांनी योग्य तो बदल केला काहीनी केला नाही हा युनिकोडचा दोष नाही. आजही W3 ने ठरवलेली सर्व प्रमाणे काही Browsers नीट अंमलात आणत नाही (उदा. IE 6 ) हा CSS किंवा HTML या प्रमाणांचा तो दोष नाही Microsoft सारखी कंपनी नीट अंमलात आणत नाही हा दोष आहे.

रिप्लाय:
हो पण users नी बोम्बाबोम्ब केली की लगेच ते त्यात सुधारणा करतात कारण त्याचा Direct Commercial Impact असतो. युनिकोड मराठी देवनागरी साठी जो user group आहे, त्याने ह्या कंपन्यांवर negligible commercial impact आहे. त्यामुळे जरी कोणी हे आक्षेप घेतले तरी त्याला शून्य priority मिळते. मूळात हा मोठा घोळ आहे हे समजण्यात आणि मान्य करण्यातच जिथे एकमत नाही तिथे सुधारणा होण्याची अपेक्षा करणेच चूक आहे.

>>>
तुला डाटाबेसची माहिती असेल तर हा क्ष आणि ज्ञ मधेच Sort होणे हा मुद्दा अनेक अभारतीय भाषांनाही आहे. त्यासाठी युनिकोडवर आधारित पण भाषेसाठी वेगळे collation sequences उपलब्ध आहेत. ते वापरले तर हा प्रश्न नाही.

रिप्लाय:
माझा मुद्दा हाच आहे की ASCII System मधे Roman Letters ना योग्य assignment केल्याने कोणतेही additional logic न लिहीता ती अक्षरे व्यवस्थित sort होतात. युनिकोडमधली अक्षरे Excel मधे Sort करुन पहा.

>>>६. लेखी लिहतांना स्वातंत्र्य असले तरी प्रत्यक्षात त्या स्वातंत्र्याचा किती उपयोग होतो हा विचार करणेही आवश्यक आहे. मांदारीन आणि कँटोनिज या भाषा संगणकावर आणताना अशा अनेक तडजोडी केल्या गेल्या. त्यामुळे भाषा तशीच्या तशी संगणकावर यायलाच हवी असे नाही.

रिप्लाय:
हे अजिबात मान्य नाही. भाषा ही त्यांच्या लिपीच्या संकेताप्रमाणे आणि योग्य रितीने यायलाच हवी. नाहीतर मिन्लिश काय वाईट? आपल्या मुलांना शिकवताना जर आपल्याला असे शिकवावे लागत असेल की 'मराठी' लिहायला 'maraaThI' टाईप कर तर आज इन्ग्रजी माध्यमात शिकणार्‍या मुलांना 'मराठी' हे 'maraaThI' असेच वाचायला देखील सोपे वाटते.

>७. अ पटले नाही. कुठला शब्द योग्य आहे का नाही हे दाखवणे त्या त्या Spellchecker वर अवलंबून आहे युनीकोडशी नाही. अगदी इंग्रजीतही color आणि colour हे चूक का बरोबर कुठला Spellchecker यावर अवलंबून आहे.

रिप्लाय:
नक्की काय पटले नाही ते कळले नाही. माझाही तोच मुद्दा आहे की स्पेलचेकर असताना अनावश्यक बन्धने कशाला?

>७. c. अजिबात पटले नाही. भातखंडे पद्धत देवनागरीशी जुळती असली तरी मुळात ती वेगळी लिपी/भाषा आहे. मी उद्या माझे संगीताचे नोटेशन काढले कि ज्यात सी शार्प ( C#) असा न लिहिता C च्या डोक्यावर शार्प असेल अशी खूण लिहायची. मला ती कागदावर लिहिता आली पण संगणकावर लिहिता आली नाही तर तो ASCII या प्रणालीचा दोष नाही.

रिप्लाय:
अजय, तुझ्या उदाहरणाप्रमाणे असेल तर मलाही मान्य आहे, मात्र ईथे तसे नाहीये. इथे असे आहे की मला C# सुद्धा लिहीता येणार नाही कारण तो valid english word नाही. भातखंडे लिपीत (चु. भु. घ्या. द्या.) मंद्र्सप्तकातील सा लिहीताना प्रत्येक स्वराखाली पाय मोडण्याचे चिह्न असते. जसे ग् . अर्थातच मन्गल फॉण्ट मधे सा चा पाय मोडण्याची सोय नाही. पुन्हा हा युनिकोड चा दोष नाही हे ऐकण्याची ईच्छा नाही, ते माहित आहेच. मात्र ह्यावर ज्या फॉण्ट मधे अशी सोय असेल असा फॉण्ट करा आणि वापरा असे उत्तर असेल (Technically only that solution is possible) आणि जरी ते केले तर एकच मजकूर वेगवेग्ळ्या फॉण्ट मधे वेगळा दिसणे हा अतिशय धोकादायक प्रकार सुरु होईल.

>>>८. पुन्हा एकदा: युनिकोडमधे एकदा असलेला मजकूर कुठल्याही प्रोग्रामला सारखाच दिसतो. तो आत टाकायची पद्धत (IME) आणि दृष्य पद्धत (Rendering) यात ज्या तृटी आहेत त्यामुळे मूळ प्रमाण चुकीचे होत नाही.

रिप्लाय:
ह्याच्यामुळे प्रमाण चु़कीचे होत नाही हे मान्य पण प्रमाणकात सुद्धा वर दाखवलेल्या त्रुटी आहेतच.

>>> कुठले अक्षर दुसर्‍या अक्षराच्या जवळ आल्यावर कसे दिसावे हे Unicode सांगत नाही ते काम एकतर Script engine करते किंवा त्याचे नियम त्या फाँट्मधेच असतात.

रिप्लाय:
नेमका हाच तर प्रोब्लेम आहे. प्रत्येक घटकाने हेच म्हटले की माझे काम मी उत्तम प्रकारे केले आहे आता पुढच्याने ते बरोबर नेले नाही त्याला मी जबाबदार नाही ते तुमचे तुम्ही बघा!

हे म्हणजे असे झाले की माझ्याकडे १kg चे 'प्रमाणित' वजन आहे पण ते फक्त माझ्याकडच्या तराजूत मोजले तरच. तुमच्या कडच्या तराजूत मोजले तर १kg तर नाहीच येणार पण किती येईल ते मी सांगू शकत नाही स्मित

>अनेक संकेतस्थळांवर असे अशुद्ध मराठी कायमस्वरुपी जतन केले जात आहे.
हे मला पटले नाही. पण घटकाभर असे धरून चालू की ते खरे आहे. पण प्रत्येक फाँट तयार करणारा त्याला वाटेल तशी प्रणाली करत होता तेंव्हा जो गोंधळ होता त्यापेक्षा ही सुधारणा आहे हे तुला पटतंय का?

रिप्लाय:
ही सुधारणा असावी अशी माझी मनापासून आणि कळकळीची अपेक्षा आहे पण माझ्या मतानुसार रोगापेक्षा इलाज भयंकर असे हे आहे. अर्थात मला जितके हे प्रखरतेने वाटते तितके सगळ्यांना वाटणारच असे नाही. ते प्रत्येकाच्या भाषेच्या आणि लिपीच्या प्रेमावरती अवलम्बून आहे. मी त्याचा जेवढा अधिक अभ्यास करतोय तितकेच ते मला अधिक प्रकर्षाने जाणवत रहातेय.

मी तर असे म्हणेन की अगदी कुठल्याही पुर्वीच्या देवनागरी फॉण्ट मधल्या सर्व अक्षरांना जरी युनिकोड मधे स्थान मिळाले असते तरी बर्‍याच प्रमाणात घोळ कमी झाला असता. मात्र सध्याचे नम्बरींग उच्चाराधिष्टीत केले गेले आहे आणि त्यातही सुसूत्रता नाही बाकी सर्व बाबी फॉण्ट, रेण्डरींग ईंजिन, ऑप्रेटींग सिस्टीम आणि अ‍ॅप्लिकेशन ह्यावर सोडलेल्या आहेत.

एकाच फॉण्ट्मधला (उदा. मंगल) मजकूर एकाच ऑपरेटिंग सिस्टीम (विंडोज) मध्ये वेगळ्या अ‍ॅप्लिकेशन्स मध्ये वेगळा दिसतो ह्या गोन्धळाला काय म्हणावे? आणि मी युनिकोड सपोर्टेड अ‍ॅप्लिकेशन्स म्हणत आहे. अनसपोर्टेड अ‍ॅप्लिकेशन्स नव्हेत. ह्यात केवळ underlying character code sequence same आहे ह्यावर मी तरी समाधानी राहू शकत नाही. पुर्वीच्या फॉण्ट्मध्ये निदान एकदा लिहीलेला मजकूर दुसरीकडे पेस्ट केला तर तो फॉण्ट इन्स्टॉल्ड असेल तर १००% नक्की तसाच दिसणार ही खात्री होती. आता तसे नाही.

शिवाय मी म्हटल्याप्रमाणे हे लिपी चे प्रमाणीकरण आहे भाषांचे नव्हे. त्यामुळे लिखीत खूणांचे प्रमाणीकरण आवश्यक आहे, उच्चाराप्रमाणे नव्हे. लिखीत खूणा उच्चाराप्रमाणे असणे हे आपल्या भाषांचे वैशिष्ट्य आहे मात्र ते १००% बरोबर नाहीए आणि नेमके हेच गृहितक युनिकोड चे नंबरींग करताना धरले गेले जे असे असायला नको होते.

वास्तविक देवनागरी लिपी ही इतकी Scientific आहे हे मला त्यावर अधिकाधिक माहिती घेतल्यावर कळत जात आहे.

अजय, वेगवेगळ्या फॉण्ट्सचा वापर ह्याने थांबला असता तर नक्कीच ते आवडले असते. पण तेही उद्दिष्ट साध्य होत नाहीये. आजही प्रिंट मिडीया, पब्लिशींग हाऊस, Visual and Creative signs येथे अजूनही वेगवेगळ्या प्रणाल्या चालूच आहेत कारण त्यांना हे मनमानी रुल्स परवडणारे नाहीत.

वेबवरचा उपयोग हा मी कॅज्युअल मानतो (माहितीची देवाण घेवाण म्हणजे तो महत्वाचा नाहीए असे नाही पण तो एकच उपयोग नाहीए) आणि सध्यातरी तेवढ्याच उपयोगापुरता युनिकोड चा उपयोग मर्यादित राहिला आहे. अगदी गूगल सर्च करण्यासाठी सुद्धा ह्यात अनेक त्रुटी आहेत. कारण एका शब्दाचे एकच स्पेलिंग असावे हेदेखील होऊ शकलेले नाहीये.

शासनाच्या कारभाराकरता युनिकोडचा वापर करावा हा अध्यादेश सुद्धा नॉन युनिकोड प्रणाल्यात टाईप करावा लागतो ह्यापेक्षा मोठा विनोद काय असेल?

>>> मुळात युनिकोड आधारीत सगळ्या प्रणाली याच एका लेखात अंतर्भूत करणे हे योग्य नाही असे माझे प्रामाणिक मत आहे. उदा. माझ्या मोबाईलवर एक जर्मन साईट नीट दिसत नाही म्हणजे सगळे HTML, CSS, Fonts, मोबाईलची OS, mobile browser सगळे अंतर्भूत करून HTML योग्य नाही म्हणण्यासारखे आहे.

रिप्लाय:
नाही. उलट असा समग्र विचारच करणे आवश्यक आहे. माझ्या मनात ह्याबद्दलच्या सोल्यूशनचा आराखडा तयार ही होत आहे मात्र त्यात अनेक तज्ञांचा सहभाग आवश्यक आहे.

विषय: 
Group content visibility: 
Public - accessible to all site users

@आरती२१
’व्यक्ती’ आणि ’व्यक्‍ती’ हे दोन्ही शब्द बरोबर आहेत. जोडाक्षरे लिहिण्याचे हे दोन प्रकार आहेत. पहिल्या प्रकाराला उभी मांडणी असे म्हणतात. तर दुसरा प्रकार आडव्या मांडणीचे उदाहरण आहे.
आडवी मांडणी - प्रश्‍न, तृप्‍त
उभी मांडणी - प्रश्न, तृप्त
अशी अनेक उदाहरणे देता येतील. पण लिखाण मात्र दोन्हीही प्रकारे बरोबरच. खात्री पटण्यासाठी उभ्या व आडव्या मांडणीचे दोन्ही शब्द गुगलमध्ये शोधून पाहा. दोन्हीना सारखेच रिझल्ट्स मिळतात.

http://tinyurl.com/y8pzet3

वर दिलेल्या पी.डी.एफ. मधील पान ६ वर दिलेले 'रक्त' या शब्दाचे उदाहरण दिलेले आहे, ते पाहा. जोडाक्षरे आडव्या मांड्णीत लिहीता येत नाहीत ही युनिकोडची मर्यादा नसून आपण टंकलेखन करताना जे सॉफ्टवेअर वापरतो, त्याचा विषय आहे. हे स्वातंत्र्य लेखकाला असावे अशी अपेक्षा चुकीची म्हणता येणार नाही. पण एकाच प्रकारे जोडाक्षरे लिहिली गेली तर वाचकांच्या (सवयीच्या) दृष्टीने ते चांगलेच ठरेल असे मला वाटते.

आरती, ही माझ्यासाठी नवीन माहिती आहे! मीदेखील 'ते' जोडाक्षर क्त
ह्या अर्थीच वापरत होतो, मात्र उलटही असू शकते.

आणि हा अजून एक घोळ गूगल क्रोम ब्रोउजर मध्ये आरतीने दाखवलेले अक्षर दिसतच नाहीए, त्यामुळे बर्‍याच जणांना नक्की काय विषय चालला आहे ते कळतच नसेल.

फक्त आरतीने टाकलेली इमेज सर्व ब्रॉऊजर मध्ये नीट दिसायला हवी.

किरण मस्त लेख आणि प्रतिक्रीया पण आवडल्या, आजयचे मत पटलेकी युनिकोडचा दोश नाही.

देवेनागरी लिपीही खुप भाषांमध्ये वापरलेली गेली असल्याने थोडे घोळ आणि बदर आहेत पण ते आपण मन्या करायला हवे, चांगल्या साठी होणारे बदल मान्य करायला हवेत.

सर्वांच्या प्रतिसादासाठी पुन्हा एकदा धन्यवाद. तसेच सर्वांना वेळेअभावी उत्तर देता येत नसले तरी जमेल तसे वाचत आहे. त्यामुळे एखाद्या प्रश्नाला उत्तर द्यायचे राहून गेले असेल तर मला विपूत लिहावे. जसे जमेल तसे मी लिहीन. कोणाचाही अनुल्लेख करायचा हेतू नाही आणि कोणतीही शंका अयोग्य नाही.

गजाननः तुमचे प्रश्नही योग्य आहेत. आणि त्यात बाळबोध असे काहीही नाहीत. मलादेखील कधीना कधी ते पडलेच होते आणि अजूनही सर्वांची योग्य उत्तरे माहित आहेतच असेही नाही. किम्बहुना मी अनेकांशी बोलूनदेखील बर्‍याच जणांना अनेक महत्वाच्या गोष्टींची सुद्धा माहितीच नसल्याचे जाणवले.

मी माझ्या मतिप्रमाणे त्याची उत्तरे द्यायचा प्रयत्न करतो.

> फॉण्ट निर्मितीची प्रक्रिया नेमकी काय असते?
उ. फॉण्ट निर्मितीची थोडक्यात प्रक्रिया अशी: (मात्र त्यात युनिकोड आधारित फॉण्ट बनवणे ह्यात अनेक क्लिष्ट गोष्टी आहेत त्याबद्दल मी नन्तर लिहीन. )
फॉण्ट वापरुन आपल्याला जी अक्षरेदिसायला हवीत त्यांचे डिझाईन कागदावर मोठ्या आकारात तयार करणे.
ती स्कॅन करुन विशीष्ट टूल्स वापरून त्यांचे vectorization करणे. देवनागरी फॉण्ट्ससाठी शिरोरेखेचे भान ठेवणे अतिशय आवश्यक असते कारण ती सलग, सारख्या जाडीची आणि एकाच उंचीची दिसणे अतिशय महत्वाचे असते. ही फाईन अ‍ॅड्ज्स्ट्मेण्ट प्रत्येक अक्षरासाठी मॅन्युअली करावी लागते. तसेच प्रत्येक फॉण्ट साईजला सर्व अक्षरे बरोबर दिसतात की नाही, ई अनेक गोष्टी पहाव्या लागतात. नन्तर विवक्षीत टूल्स वापरुन मानकाप्रमाणे अक्षरे योग्य सांकेतांकाना जोडून घेणे. ही ASCII व True Type Font बनवण्याची पद्धत झाली.

मात्र युनिकोड देवनागरीसाठी Open Type Font वापरावा लागतो आणि त्यात अतिशय क्लिष्ट असे Rules scripting करावे लागते. त्याच्या तपशीलात मी सध्या शिरत नाहीये.

> एखाद्या लिपीला युनिकोडमध्ये स्थान मिळवण्यासाठी काय करावे लागते?
उ. युनिकोड कंझॉर्टियम ही एक स्वायत्त संस्था आहे. http://www.unicode.org ह्या दुव्यावर अधिक माहिती मिळु शकेल.
मात्र ह्यात स्थान मिळवण्यासाठी काय करावे लागते त्याचा तपशील मला माहित नाही.

> त्यात पुन्हा बदल करायचे असतील तर काय करावे लागते? बदलाला कोणाची मान्यता असायला लागते. यात मदत करायची इच्छा असल्यास कोणाच्या संपर्कात राहिले पाहिजे?
उ. युनिकोडच्या स्थापना झाल्यावर त्याच्या प्रमोटर्सनी जगातील सर्व writing systems चा सर्वे घेउन काही भाषा निश्चित केल्या तसेच जरी ही नॉन प्रॉफिट ऑर्गनायझेशन असली तरी त्यावर त्याच्या promoters चा खूप प्रभाव आहे. त्यामूळे जरी एखादा बदल सजेस्ट केला तरी तो अमलात यावा अथवा नाही ह्यावरती अंतिम निर्णय जरी त्यांना भाषेबाबत काहीही माहिती नसली तरी तेच घेऊ शकतात. आणि ह्यामुळेच साध्या साध्या गोष्टींसाठी सुद्धा (मराठीतला अर्धा र, बंगालीमधला खण्ड त) खूप पाठपुरावा करावा लागतो असे ऐकून आहे. शिवाय ह्यात कालापव्यय झाल्याने तोपर्यंत इतर प्रणाल्यांमधे त्रुटी राहून जातात आणि नन्तर जरी त्यात बदल झालाच तरी इतर प्रणाल्यांवर जी जबाबदारी सोपविली आहे त्याचे निर्माते वेगवेगळे असल्याने तसेच त्यांना हे बदल अमलात आणायचे कुठलेच बंधन नसल्याने हे बदल आपल्यापर्यंत पोचण्यास अनेक वर्षे जातात. युनिकोड्चे आत्तचे version 5.2 आहे. जवळ जवळ सर्व मेजर व्हर्जन मध्ये देवनागरी अक्षरे त्यात टाकली गेली मात्र युनिकोड आधारित फॉण्ट मधे त्याची अंमल्बजावणी त्या त्वरेने होऊ शकत नाही.

एकाच लिपीचे वेगवेगळे फॉण्ट युनिकोडमध्ये असू शकतात का? (वर तुम्ही ६४००० गुणिले १७ असा हिशेब दिला आहे. म्हणजे प्रत्येक लिपीच्या / भाषेच्या वाट्याला मर्यादित युनिकोड येत असतील ना?)

उ. हो. आणि ते असायलाच हवेत, तरच काहीतरी उपयोगी गोष्ट घडू शकते. मात्र देवनागरी युनिकोड फॉण्ट कसे बनवावेत ह्याबाबत अतिशय कमी माहिती सध्या उपलब्ध आहे. जी आहे ती मी समजून घ्यायचा प्रयत्न केला पण ती जणू काही कोणाला समजू नये अशाच प्रकारे लिहीली असावी असे वाटावे असा संशय यावा अशी परिस्थीती आहे. अर्थात हे माझे स्वतःचे मत आहे. मात्र एक गोष्ट निश्चित की एक युनिकोड देवनागरी फॉण्ट बनवण्यासाठी लागणारे परिश्रम एका माणसाच्या आवाक्याबाहेर आहेत.

इतरांना ह्याबद्दल आणखी माहिती असेल तर कृपया द्यावी.

अजय, हा तुझ्या काही इतर मुद्द्यांवरचा रीप्लायः
ज्या मुद्द्यांवरती तुझा रिप्लाय युनिकोडच्या आवाक्याबाहेर आहेत असा आहे, ते मलासुद्धा मान्य आहे, मात्र भारतीय - देवनागरी - मराठी - end user ह्या नात्याने उपलब्ध सोल्यूशन ने अनेक प्रश्न निर्माण केले आहेत.
त्याबद्दल हे सर्व.

>>>
१. तुझे मुद्दे बरोबर असले तरी युनिकोडच्या संदर्भात पटत नाही. मुळात Ascii पद्धत का सुरु झाली? तर वेगवेगळ्या Operating system मधे असलेला Data सहज एका संगणकावरून दुसरीकडे नेता यावा म्हणून. यात डाटा Input कसा करावा हे कुठेच लिहिलेले नाही. उदा. QWERTY पद्धतीची एकच input method असूनही Ascii आणि EBCDIC अशा दोन अंतर्गत पद्धती होत्याच की. त्यामुळे Unicode, फक्त एकदाच Unicode मधे असलेला Data कुठल्याही संगणकावर सारखा कसा वापरता येईल यासाठी तयार केली गेली आहे. IME चे प्रमाणिकी करण आवश्यक हा तुझा मुद्दा योग्य असला तरी युनि़कोडच्या आवाक्याबाहेरचा तो मुद्दा आहे.

रिप्लाय:
EBCDIC ह्या पद्धतीतही असेच अनेक दोष होते जसे की A साठी चा Code + 1, असे केल्यावर B चा कोड यावा इतके साधे logic सुद्धा त्यात नव्हते. म्हणजेच A to Z ला Continous Code Assignment नव्हती, त्यामुळे programmers च्या डोक्याला इतका अनावश्यक त्रास झाला की ती सिस्टीमच रद्दबातल झाली आणि ASCII अस्तित्वात आली.

"Information Interchange" इतके सिमीत objective जरी आपण युनिकोड च्या बाबतीत ठेवले तरी त्या त्या लिपीतील सर्व प्रमाणभूत अक्षरांना प्रमाणित स्थान मिळाले नसल्याने (अर्थात हे माझे मत आणि ह्याबाबत अनेक मतमतांतरे असू शकतात आणि ह्यासंदर्भात पलिकडूल बाजूचे काही मुद्दे देखील मला मान्य आहेत). उदाहरण द्यायचे झाले तर समजा आपण इन्ग्लिश करता प्रमाणीकरण करत आहोत आणि समजा त्यात X, Y, Z ही अक्षरेच घेतली नाहीत. आणि ती न घेतल्यामुळे होणारा घोळ थांबवण्यासाठी असे वर्क अराऊंड काढले की X म्हणजेच A*, Y म्हणजेच B*, Z म्हणजेच C*. अशा प्रकरचे घोळ युनिकोड मध्ये झाले आहेत. शिवाय नंतर पाठपुराव्यामुळे X, Y, Z त्यात घातले गेल्यावर होणारे घोळ तर अवर्णनीय आहेत.
त्यामुळे Backward Compatibility च्या नावाखाली वर्क अराऊंड ही व्हॅलीड ठरते आणि नवीन कोड सुद्धा!
आज अर्धा र लिहायच्या २ पद्धती अस्तित्वात आहेत

१. नुक्ता वाला र, पाय मोडायचे चिह्न
२. नेहमीचा र, पाय मोडायचे चिह्न, ZWJ (Zero Width Joiner)

शिवाय युनिकोड हे म्हणायला मोकळे आहेच की आम्ही थोडेच सांगितले होते की आमच्या वर आधारित सिस्टीम बनवा! आणि ते खरेच आहे. हे आपल्यालाच ठरवायचे आहे की आपण आहेत त्या त्रूटींसकट केवळ ते एकमेव मानक अस्तित्वात आहे म्हणून तसेच चालवून घ्यायचे की एखादे नवीन Open Source Standard वापरायचे?

>>>२ a. हा युनिकोडचा दोष नाही. युनिकोडच्या एका जुन्या आवृत्तीत अर्धा र (र्‍) नव्हता. TDIL ने त्याबद्दल पाठपुरावा करून तो नवीन आवृत्तीत आणला (२००४ मधे). त्याबद्दलची चर्चा अजूनही जालावर उपलब्ध आहे ( http://unicode.org/~emuller/iwg/p8/index.html) पण ती सुधारण झाल्यावर काही फाँट निर्मात्यांनी योग्य तो बदल केला काहीनी केला नाही हा युनिकोडचा दोष नाही. आजही W3 ने ठरवलेली सर्व प्रमाणे काही Browsers नीट अंमलात आणत नाही (उदा. IE 6 ) हा CSS किंवा HTML या प्रमाणांचा तो दोष नाही Microsoft सारखी कंपनी नीट अंमलात आणत नाही हा दोष आहे.

रिप्लाय:
हो पण users नी बोम्बाबोम्ब केली की लगेच ते त्यात सुधारणा करतात कारण त्याचा Direct Commercial Impact असतो. युनिकोड मराठी देवनागरी साठी जो user group आहे, त्याने ह्या कंपन्यांवर negligible commercial impact आहे. त्यामुळे जरी कोणी हे आक्षेप घेतले तरी त्याला शून्य priority मिळते. मूळात हा मोठा घोळ आहे हे समजण्यात आणि मान्य करण्यातच जिथे एकमत नाही तिथे सुधारणा होण्याची अपेक्षा करणेच चूक आहे.

>>>
तुला डाटाबेसची माहिती असेल तर हा क्ष आणि ज्ञ मधेच Sort होणे हा मुद्दा अनेक अभारतीय भाषांनाही आहे. त्यासाठी युनिकोडवर आधारित पण भाषेसाठी वेगळे collation sequences उपलब्ध आहेत. ते वापरले तर हा प्रश्न नाही.

रिप्लाय:
माझा मुद्दा हाच आहे की ASCII System मधे Roman Letters ना योग्य assignment केल्याने कोणतेही additional logic न लिहीता ती अक्षरे व्यवस्थित sort होतात. युनिकोडमधली अक्षरे Excel मधे Sort करुन पहा.

>>>६. लेखी लिहतांना स्वातंत्र्य असले तरी प्रत्यक्षात त्या स्वातंत्र्याचा किती उपयोग होतो हा विचार करणेही आवश्यक आहे. मांदारीन आणि कँटोनिज या भाषा संगणकावर आणताना अशा अनेक तडजोडी केल्या गेल्या. त्यामुळे भाषा तशीच्या तशी संगणकावर यायलाच हवी असे नाही.

रिप्लाय:
हे अजिबात मान्य नाही. भाषा ही त्यांच्या लिपीच्या संकेताप्रमाणे आणि योग्य रितीने यायलाच हवी. नाहीतर मिन्लिश काय वाईट? आपल्या मुलांना शिकवताना जर आपल्याला असे शिकवावे लागत असेल की 'मराठी' लिहायला 'maraaThI' टाईप कर तर आज इन्ग्रजी माध्यमात शिकणार्‍या मुलांना 'मराठी' हे 'maraaThI' असेच वाचायला देखील सोपे वाटते.

>७. अ पटले नाही. कुठला शब्द योग्य आहे का नाही हे दाखवणे त्या त्या Spellchecker वर अवलंबून आहे युनीकोडशी नाही. अगदी इंग्रजीतही color आणि colour हे चूक का बरोबर कुठला Spellchecker यावर अवलंबून आहे.

रिप्लाय:
नक्की काय पटले नाही ते कळले नाही. माझाही तोच मुद्दा आहे की स्पेलचेकर असताना अनावश्यक बन्धने कशाला?

>७. c. अजिबात पटले नाही. भातखंडे पद्धत देवनागरीशी जुळती असली तरी मुळात ती वेगळी लिपी/भाषा आहे. मी उद्या माझे संगीताचे नोटेशन काढले कि ज्यात सी शार्प ( C#) असा न लिहिता C च्या डोक्यावर शार्प असेल अशी खूण लिहायची. मला ती कागदावर लिहिता आली पण संगणकावर लिहिता आली नाही तर तो ASCII या प्रणालीचा दोष नाही.

रिप्लाय:
अजय, तुझ्या उदाहरणाप्रमाणे असेल तर मलाही मान्य आहे, मात्र ईथे तसे नाहीये. इथे असे आहे की मला C# सुद्धा लिहीता येणार नाही कारण तो valid english word नाही. भातखंडे लिपीत (चु. भु. घ्या. द्या.) मंद्र्सप्तकातील सा लिहीताना प्रत्येक स्वराखाली पाय मोडण्याचे चिह्न असते. जसे ग् . अर्थातच मन्गल फॉण्ट मधे सा चा पाय मोडण्याची सोय नाही. पुन्हा हा युनिकोड चा दोष नाही हे ऐकण्याची ईच्छा नाही, ते माहित आहेच. मात्र ह्यावर ज्या फॉण्ट मधे अशी सोय असेल असा फॉण्ट करा आणि वापरा असे उत्तर असेल (Technically only that solution is possible) आणि जरी ते केले तर एकच मजकूर वेगवेग्ळ्या फॉण्ट मधे वेगळा दिसणे हा अतिशय धोकादायक प्रकार सुरु होईल.

>>>८. पुन्हा एकदा: युनिकोडमधे एकदा असलेला मजकूर कुठल्याही प्रोग्रामला सारखाच दिसतो. तो आत टाकायची पद्धत (IME) आणि दृष्य पद्धत (Rendering) यात ज्या तृटी आहेत त्यामुळे मूळ प्रमाण चुकीचे होत नाही.

रिप्लाय:
ह्याच्यामुळे प्रमाण चु़कीचे होत नाही हे मान्य पण प्रमाणकात सुद्धा वर दाखवलेल्या त्रुटी आहेतच.

>>> कुठले अक्षर दुसर्‍या अक्षराच्या जवळ आल्यावर कसे दिसावे हे Unicode सांगत नाही ते काम एकतर Script engine करते किंवा त्याचे नियम त्या फाँट्मधेच असतात.

रिप्लाय:
नेमका हाच तर प्रोब्लेम आहे. प्रत्येक घटकाने हेच म्हटले की माझे काम मी उत्तम प्रकारे केले आहे आता पुढच्याने ते बरोबर नेले नाही त्याला मी जबाबदार नाही ते तुमचे तुम्ही बघा!

हे म्हणजे असे झाले की माझ्याकडे १kg चे 'प्रमाणित' वजन आहे पण ते फक्त माझ्याकडच्या तराजूत मोजले तरच. तुमच्या कडच्या तराजूत मोजले तर १kg तर नाहीच येणार पण किती येईल ते मी सांगू शकत नाही Happy

>अनेक संकेतस्थळांवर असे अशुद्ध मराठी कायमस्वरुपी जतन केले जात आहे.
हे मला पटले नाही. पण घटकाभर असे धरून चालू की ते खरे आहे. पण प्रत्येक फाँट तयार करणारा त्याला वाटेल तशी प्रणाली करत होता तेंव्हा जो गोंधळ होता त्यापेक्षा ही सुधारणा आहे हे तुला पटतंय का?

रिप्लाय:
ही सुधारणा असावी अशी माझी मनापासून आणि कळकळीची अपेक्षा आहे पण माझ्या मतानुसार रोगापेक्षा इलाज भयंकर असे हे आहे. अर्थात मला जितके हे प्रखरतेने वाटते तितके सगळ्यांना वाटणारच असे नाही. ते प्रत्येकाच्या भाषेच्या आणि लिपीच्या प्रेमावरती अवलम्बून आहे. मी त्याचा जेवढा अधिक अभ्यास करतोय तितकेच ते मला अधिक प्रकर्षाने जाणवत रहातेय.

मी तर असे म्हणेन की अगदी कुठल्याही पुर्वीच्या देवनागरी फॉण्ट मधल्या सर्व अक्षरांना जरी युनिकोड मधे स्थान मिळाले असते तरी बर्‍याच प्रमाणात घोळ कमी झाला असता. मात्र सध्याचे नम्बरींग उच्चाराधिष्टीत केले गेले आहे आणि त्यातही सुसूत्रता नाही बाकी सर्व बाबी फॉण्ट, रेण्डरींग ईंजिन, ऑप्रेटींग सिस्टीम आणि अ‍ॅप्लिकेशन ह्यावर सोडलेल्या आहेत.

एकाच फॉण्ट्मधला (उदा. मंगल) मजकूर एकाच ऑपरेटिंग सिस्टीम (विंडोज) मध्ये वेगळ्या अ‍ॅप्लिकेशन्स मध्ये वेगळा दिसतो ह्या गोन्धळाला काय म्हणावे? आणि मी युनिकोड सपोर्टेड अ‍ॅप्लिकेशन्स म्हणत आहे. अनसपोर्टेड अ‍ॅप्लिकेशन्स नव्हेत. ह्यात केवळ underlying character code sequence same आहे ह्यावर मी तरी समाधानी राहू शकत नाही. पुर्वीच्या फॉण्ट्मध्ये निदान एकदा लिहीलेला मजकूर दुसरीकडे पेस्ट केला तर तो फॉण्ट इन्स्टॉल्ड असेल तर १००% नक्की तसाच दिसणार ही खात्री होती. आता तसे नाही.

शिवाय मी म्हटल्याप्रमाणे हे लिपी चे प्रमाणीकरण आहे भाषांचे नव्हे. त्यामुळे लिखीत खूणांचे प्रमाणीकरण आवश्यक आहे, उच्चाराप्रमाणे नव्हे. लिखीत खूणा उच्चाराप्रमाणे असणे हे आपल्या भाषांचे वैशिष्ट्य आहे मात्र ते १००% बरोबर नाहीए आणि नेमके हेच गृहितक युनिकोड चे नंबरींग करताना धरले गेले जे असे असायला नको होते.

वास्तविक देवनागरी लिपी ही इतकी Scientific आहे हे मला त्यावर अधिकाधिक माहिती घेतल्यावर कळत जात आहे.

अजय, वेगवेगळ्या फॉण्ट्सचा वापर ह्याने थांबला असता तर नक्कीच ते आवडले असते. पण तेही उद्दिष्ट साध्य होत नाहीये. आजही प्रिंट मिडीया, पब्लिशींग हाऊस, Visual and Creative signs येथे अजूनही वेगवेगळ्या प्रणाल्या चालूच आहेत कारण त्यांना हे मनमानी रुल्स परवडणारे नाहीत.

वेबवरचा उपयोग हा मी कॅज्युअल मानतो (माहितीची देवाण घेवाण म्हणजे तो महत्वाचा नाहीए असे नाही पण तो एकच उपयोग नाहीए) आणि सध्यातरी तेवढ्याच उपयोगापुरता युनिकोड चा उपयोग मर्यादित राहिला आहे. अगदी गूगल सर्च करण्यासाठी सुद्धा ह्यात अनेक त्रुटी आहेत. कारण एका शब्दाचे एकच स्पेलिंग असावे हेदेखील होऊ शकलेले नाहीये.

शासनाच्या कारभाराकरता युनिकोडचा वापर करावा हा अध्यादेश सुद्धा नॉन युनिकोड प्रणाल्यात टाईप करावा लागतो ह्यापेक्षा मोठा विनोद काय असेल?

>>> मुळात युनिकोड आधारीत सगळ्या प्रणाली याच एका लेखात अंतर्भूत करणे हे योग्य नाही असे माझे प्रामाणिक मत आहे. उदा. माझ्या मोबाईलवर एक जर्मन साईट नीट दिसत नाही म्हणजे सगळे HTML, CSS, Fonts, मोबाईलची OS, mobile browser सगळे अंतर्भूत करून HTML योग्य नाही म्हणण्यासारखे आहे.

रिप्लाय:
नाही. उलट असा समग्र विचारच करणे आवश्यक आहे. माझ्या मनात ह्याबद्दलच्या सोल्यूशनचा आराखडा तयार ही होत आहे मात्र त्यात अनेक तज्ञांचा सहभाग आवश्यक आहे.

लांबलचक आणि कदाचित रटाळ पोष्टसाठी क्षमस्व. पण आत्ता थोडा वेळ मिळाला म्हणुन जेवढ्या मुद्द्यांचा समावेश करता आला तेवढा केला.

सर्वांना हा विषय थोडा मूळापासून समजल्यावर हे विवेचन अर्थपूर्ण वाटेल.

मी ह्यावर एक प्रेसेण्टेशन बनवले आहे. त्यात ASCII पासुन Unicode बद्दल देवनागरीच्या संदर्भात जेवढे जमेल तेवढी माहिती आहे.

इथे ती attach करता येत नाही. ज्यांना टेक्निकली ह्यात रस आहे त्यांनी मला Contact करावे त्यांना ती फाईल मी इमेल करेन.

किरण, उत्तरांबद्दल मनापासून धन्यवाद.

आणि तुमच्या पोस्टी रटाळ वगैरे अजिबात नाहीत. त्यातून आणि बाकीच्यांच्या प्रतिक्रियांतून माझ्यासारख्याला अनेक दिवसांपासून पडणार्‍या प्रश्नांची उत्तरे मिळण्यास मदत होतेय. तुमच्या मायबोलीवरच्या संपर्कातून तुमच्याशी संपर्क साधला आहे. कृपया मलाही तुमचे युनिकोडसंदर्भातले सादरीकरण पाठवा.

@किरण
प्रतिसादाबद्दल धन्यवाद. तू इथे सगळे मुद्दे एकत्र मांडायचं चांगलं काम केले आहे. परंतू त्यातला प्रत्येक मुद्दा एक स्वतंत्र चर्चा व्हावी असा मोठा आहे. मला असं सुचवायचं आहे की एक वेगळा युनिकोडवर चर्चा करणारा ग्रूप सुरु करावा आणि प्रत्येक मुद्यांसाठी वेगळा धागा सुरु करावा. ग्रूपचा अजून एक फायदा म्हणजे काही ठोस काम करायचे असेल तर त्याचे संयोजन करण्यासाठीही त्याचा उपयोग करता येईल.

तुझ्या काही प्रतिक्रीयांवर माझ्या काही कल्पना.

सध्यापुरते ७c संगिताचे नोटेशन आपण थोडे तात्पुरते बाजुला ठेवूया का? कारण ते थोडेसे मूळ विषयाच्या बाजूला आहे. बाकीचे मुद्दे संपले की पुन्हा त्याच्याकडे लक्ष देवूया.
(तुझ्या या लेखामुळे मी नेटवर याबद्दल शोध घ्यायला सुरुवात केली. भारतीय संगीत पद्धतीला युनीकोडमधे समाविष्ट करून घेता येईल का असा प्रश्न त्यावेळच्या समितीने विचारला होता. ३१ ऑगस्ट २००४ ला विचारलेला प्रश्न आजही अनुत्तरीत आहे. http://unicode.org/~emuller/iwg/p31/index.html )

दुसरा एक मुद्दा म्हणजे साहेब , तालुका यासारख्या शब्दांच्या लघुलेखनाबद्दल. ( किंवा इतर स्वातंत्र्याबद्दल) हे लिहण्याची प्रथा आज छापील माध्यमात, रोजच्या व्यवहारात केंव्हाच नष्ट झाली हे तुला मान्य असेल तर हा ही मुद्दा थोडा बाजूला ठेवूया का?

@shantanuo,
जुनी पाने चाळली तर असे दिसते की युनीकोड तयार करणार्‍या मुख्य व्यक्ती भारतीय नसल्या तरी त्यांनी अनेक भारतीय तज्ञांचा सल्ला घेतलेला दिसतोय. तरिसुद्धा काही गोष्टी राहून गेलेल्या दिसतात.
http://unicode.org/~emuller/iwg/
http://www.unicode.org/~ecartis/indic/
http://www.unicode.org/faq/indic.html
http://tdil.mit.gov.in/faq.htm
इथे बर्‍याच जुन्या चर्चा उपलब्ध आहेत. त्यातल्या काही वाचल्यावर आपल्यालाच आपल्या भाषेबद्दल किती कमी माहिती आहे असं मला तरी प्रामाणिकपणे वाटून गेलं आणि हे काम किती मोठं होतं आणि त्यांनी आत्ता ज्या पातळीवर आणलं त्याबद्दल मला तरी त्या काम करणार्‍या सगळ्यांबद्दल खूप आदर वाटला.

इथून पुढे दोन मार्ग आहेत.
१) युनिकोड मुख्यत्वे योग्य आहे पण युनिकोडमधे काही दोष राहून गेले आहेत आणि त्यात बदल करायची आवश्यकता आहे.
या मार्गाने जायचे असेल तर भारत सरकार आता अधिकृतपणे Unicode consortium चा भाग आहे. TDIL (http://tdil.mit.gov.in) हा सरकारी विभाग खास त्यासाठी आहे. त्यांच्याबरोबर संपर्कात राहून या अडचणी दूर करण्यासाठी प्रयत्न करता येतील.
indic@unicode.org या नावाची mailing list पूर्वी कार्यरत होती असे दिसते. आता आहे का ते माहिती नाही त्यात कसे सामील व्ह्यायचे ते माहिती नाही. पण देवनागरीबद्दलच्या काही महत्वपूर्ण चर्चा या mailing list झालेल्या दिसतात.

२) युनिकोड मूळातच योग्य नाही आणि ते संपूर्ण बदलून दुसरे काही केले पाहिजे असे मानणाराही एक समूह आहे. यातली काही मंडळी वेगवेगळ्या माध्यमातून त्याबद्दल सांगत असतात. आणि युनिकोडसाठी पर्याय निर्माण करण्याचा त्यांचा प्रयत्न आहे. माझ्या तुटपुंज्या माहितीनुसार फक्त मराठी भाषेसाठी असे काही करावे असा या प्रयत्नांचा आवाका आहे. (त्यापेक्षा मोठा असला तर मला तरी माहिती नाही)

या दोन पैकी कुठला तरी मार्ग घेऊन पुढे काहितरी करायला पाहिजे. इथे किंवा इतर कुठल्याही संकेतस्थळावर नुसती चर्चा करून त्यातून काही निष्पन्न होणार नाही.

माझे वैयक्तिक मत २) हा मार्ग सध्यातरी खूपच अवघड वाटतोय याचे कारण म्हणजे जितकं युनि़कोड तयार करताना आलेल्या अडचणींबद्दल समितीच्या Mailing list ची बखर वाचतोय तितकं हे काम किती मोठं आणि क्लिष्ट आहे हे दिसतंय. आणि दुसरं असं की आपल्याला मराठीपुरतं आवडो वा न आवडो सगळं जग इतर भाषांकरता तरी युनिकोड वापरू लागलंय. त्यामुळे सगळ्या संगणकांवर युनिकोड एवितेवी असणारचं आणि देवनागरीकरता नवीन पर्याय शोधला तरी त्याला युनिकोडच्या शेजारी (युनिकोडला न वगळता) काम करणं भाग आहे.

shantanuo
ह्या लिन्कबद्दल धन्यवाद, तीच मी शोधत होतो.

मात्र मला आरतीचा मुद्दा पटतोय.
हा युनिकोडशी थेट संबंधात नसला तरी त्यामुळे उद्भवलेल्या मुख्य प्रश्नांपैकी एक आहे त्यामुळे अस्थानी नाही.
मात्र ह्यावर आणखी चर्चा आवश्यक वाटत असेल तर वेगळा धागा काढू.

खालील इमेज मधे हा प्रश्न सर्वांना योग्य प्रकारे दिसेल.

(नोंदः खालील अक्षरे किरण फॉण्ट मध्ये लिहीता येत असल्याने त्यात लिहीली आहेत.)

akshare.jpg

अजय,

हो गृप स्थापन करायला काहीच हरकत नाही. आणि ह्याकामी मायबोलीची खरच खूप मोलाची मदत होऊ शकते.

मी ह्या लिन्क्स चे वाचन केव्हाच केलेले आहे तसेच त्या मेलिंग लिस्ट बद्दलही मला माहित आहे. अनेक तज्ञ मंडळी हिरीरीने आपले मुद्दे मांडूनसुद्धा काही परिणाम होत नाही असे पाहून त्यातून कंटाळून बाहेर पडली इतकी की हे दगडावर डोके आपटण्यासारखे आहे इतक्या टोकाच्या प्रतिक्रिया देऊन. कदाचित त्यामुळेच हे काम अर्धवट / अपुरे राहिले असण्याची शक्यता आहे.

मलाही माहित आहे की हे काम केव्हढे मोठे आहे आणि सर्वाधिक दु:ख ह्याचेच होते की वेगवेगळ्या पातळीवर इतके अजस्त्र काम करुनही समाधानकारक उत्तर ह्यातून मिळाले नाही.

> साहेब , तालुका यासारख्या शब्दांच्या लघुलेखनाबद्दल
माझा मुद्दा इतक्याकरताच मर्यादित नाही तर लिपीचा वापर हा भाषेपुरता मर्यादित ठेवण्यावरती आहे. त्यातील अनेक उदाहरणांपैकी हे एक. Musical Notations हे दुसरे.

तू सुचविलेले दोन्ही पर्याय बरोबर आहेत आणि मी देखील पहिल्याच पर्यायाला पसंती देईन. मात्र Acceptable solution हे असेल की देवनागरी Code Range 0900- 097F ही पूर्णपणे revamp करणे, जे सध्याच्या Unicode Consortium च्या policy च्या विरोधात आहे.

अजय,
खालील लिन्कवरती असलेले हे पत्र पुरेसे बोलके आहे. ह्यातील पत्रलेखकाच्या मताशी मी बर्‍याच प्रमाणात सहमत आहे. हे १९९७ सालचे आहे.

http://unicode.org/mail-arch/unicode-ml/Archives-Old/UML006/0194.html

मी सन्दिप शी सम्पर्क साधण्याचा प्रयत्न केला पण जमले नाही.

किरण , धन्यवाद २ कारणांसाठी. माझी प्रतिक्रिया लिहिल्यानंतर आलेल्या काही प्रतिक्रिया वाचल्यावर मी माझा आग्रह माझ्यापुरताच ठेवायचा असं म्हणून गप्प बसायचं ठरवलं. पण तुमची पोस्ट अतिशय आश्वासक वाटली. असा सकारात्मक दृष्टिकोण कोणत्याही बदलाला, प्रगतीला नेहमीच उपयुव-त ( कशी वाटली माझी युव-ती ? ) ठरतो. या तुमच्या सकारात्मक दृष्टिकोणासाठी धन्यवाद !
दुसरे तुमच्या या सर्व कष्ट घेण्याबद्दल एक वाचक आणि एक लेखक म्हणून धन्यवाद !
तुमच्या कार्याला शुभेच्छा ! मला करता येणारी मदत करायला उत्सुक आहे.
मनापासून धन्यवाद !
ता. क. >>>फक्त आरतीने टाकलेली इमेज सर्व ब्रॉऊजर मध्ये नीट दिसायला हवी.<<< यासाठी मी काय करायला हवं ? खरं तर ती जेपेग इमेज आहे, मग ती का दिसत नाही ?
क्र साठी तुम्ही म्हणता ते पटते, हे अक्षर मुळातूनच चुकीचे वाटते.

आरती२१, सुदैवाने इमेज फाईल्स सर्व ब्रॉऊजर मध्ये सारख्याच दिसतात. त्यामुळे तुमची फाईल सर्वांना बरोबर दिसेल. मात्र त्यात ते विविक्षीत अक्षर क्त नाहीये. म्हणून मी वरती अजून एक इमेज टाकली.

मी सांगितलेले क्र हे अक्षर कोणी सांगावे, कुठल्यातरी छापखान्यातील 'क्र' ह्या खिळ्याच्या खालील भाग झिजल्याने तसे उत्पन्न झालेले असु शकते किंबहुना मला तरी तीच शक्यता अधिक वाटते.

एकदा एखादी वहिवाट पडली की सहसा लोक त्याचा सरधोपटपणे वापर करतात आणि नंतर तो इतका अंगवळणी पडतो की त्यात चूक असली तरी तेच बरोबर वाटावयास लागते.

तसेच उच्चारांबाबत. आज आपल्यापैकी किती जण ङ, ञ ह्या व्यंजनांचा अचूक उच्चार करु शकतात? मी तरी छातीठोकपणे सांगू शकत नाही. मात्र देवनागरीचे हे एक वैशिष्ट्य फार थोड्या जणांना माहित असेल की
ङ ह्या अक्षराचा अचूक उच्चार अंक, डंख, अंग ह्यातील अनुस्वाराच्या उच्चारासारखा आहे.

वाङमय मात्र जोडाक्षर आहे कारण वांमय असे लिहिले तर त्याचा उच्चार वाम्मय असा होतो.

https://docs.google.com/leaf?id=0B6B158ZxVvoDYmU5ZjEyOGItMzhiZi00YzI5LTh...

इथे प्रेझेन्टेशन शेअर केले आहे. ह्यात मी मुळापासून माहिती द्यायचा प्रयत्न केला आहे. त्याचे मराठीत भाषांतर करायचा प्रयत्न केला पण झेपले नाही. त्यामुळे English मध्येच आहे.

त्यात काही ठिकाणी किरण फॉण्ट मधील अक्षरे आहेत कारण ती तशीच्या तशी दिसणे आवश्यक आहे. पण ती त्यात embed केल्यामुळे फॉण्ट install न करताही दिसायला हवीत. दिसली नाहीत तरी kiranfont.com वरुन एकदाच फॉण्ट डाऊन्लोड व इन्स्टॉल करु शकता.

काही शंका असतील तर जरुर विचारा. निदान सर्वांना ही बेसिक माहिती असणे जरुरीचे आहे, त्यामुळे एखादी अडचण आल्यास नक्की काय होते हे लक्षात येण्यास मदत होईल.

वास्तविक देवनागरी लिपी ही इतकी Scientific आहे हे मला त्यावर अधिकाधिक माहिती घेतल्यावर कळत जात आहे.
>>

किरण, तू हे वर कुठल्यातरी पोस्टमध्ये लिहिले आहेस. जमल्यास एक लेख लिही ना ह्याच्यावर. वाचायला आवडेल. Happy

किरण तुमचा लेख चांगला आहे आणि तुम्ही मांडलेले प्रश्नहि बरोबर आहेत.
कदाचित इथे लिहिणे योग्य होईल म्हणुन लिहिते.
अलिकडेच मी google marathi transliteration IME डाउनलोड केल (विन्डोज वर). ते वापरुन, कुठल्याही सॉफ्ट्वेअर मधे (नोट्पॅड,वर्ड, आउट्लुक, एडिट्प्लस इ. मी ट्राय केलेले) मराठीमधे एकाच पद्धतीने टाईप करता येते.
टाईप करताना शब्द सुचवण्याच कामही करते. (ऑटोकम्प्लिट) टाईप करण्याची पद्धत नेहेमी सारखि असल्याने वेगवेगळे टाईप करण्याचा त्रास कमी वाटला मला. भाषा स्विच करताना Atl+shift दाबुन करता येत.
मला मराठी टाईप करण्याची ही चांगली पद्धत वाटली.

यात काही त्रुटी आहेत, त्या गुगल ला बर्‍याच जणांनी सांगितल्या तर कमी होतील अस वाटतय. म्हणजे ऑ , अ‍ॅ कधीकधी टाइप करता येत नाहिये. अजुनही बर्‍याच असतील ज्या मला माहित नाहीत.

माझ्या वरच्या लांबलचक पोष्टींमध्ये सुद्धा बरीच माहिती अडकून पडली आहे. वेळ झाला की ती काढून मूळ लेखात टाकेन.

किरण यांस,
काल मी आपले हे लिखाण वाचल्यानंतर केएफ फाँट्स डाऊनलोड करून ऑफलाईन टाईप करून मायबोली मध्ये कॉपी व पेस्ट केले. पण ते रोमन लिपितच प्रदर्शीत झाले. मी या संबंधी आपल्याला फीडबॅक पाठवला होता. आता मला हे देवनागरीमध्येच कसे पेस्ट करावे यासंबंधी महिती हवी आहे. कृपया कळवावे ही विनंती.

रवींद्रजी, आपणांस मेल केली आहे.

मायबोली साईट युनिकोड आधारित प्रणाली वापरत असल्याने किरण फॉण्ट इथे प्रदर्शित होऊ शकणार नाहीत. मात्र आपण किरण फॉण्ट मधले लिखाण युनिकोड मध्ये खालील पद्धतीने बदलू शकता.

अर्थात, मायबोलीवर लिहीण्यासाठी मी ही पद्धत सुचवत नाही कारण असे करणे खुपच जिकीरीचे आहे.

1. Save your KF-Kiran typed text into a text file (notepad) such as maayboli.txt (Let it appear as English Text)

2. Visit http://uni.medhas.org/fileconverterindex.php5

3. Browse and select the Text File on your PC

4. Select KF-Kiran from the drop down and click "Convert"

5. Download and open the Text File.

6. This text is in Unicode and you can copy and paste it into maayboli.com

7. Enjoy!

त्याचप्रमाणे युनिकोड मधला मजकूर किरण फॉण्ट मध्ये बदलण्यासाठी खालील पद्धत वापरता येईल.
If you want to edit any Text written in Unicode, You can Visit http://www.kiranfont.com and click on "Conversion Utilities", paste the Unicode text into Left Box and Click on "KF-Kiran"

धन्यवाद!

युनिकोड बद्दल काही अडचणी असतील, उदाहरणार्थ वर्डमधे युनिकोड वापरताना कधी कधी पेजवर अक्षरे न उमटता भलत्याच ठीकाणी उमटणे इत्यादी इथे मांडल्या तर चालेल की त्यासाठी वेगळा धागा उघडावा लागेल?

मला स्वतःला मायबोली चे फोनेटिक सॉफ्टवेर खूप सोपे आणि सुटसुटीत वाटते पण ते ऑफ लाईन स्वरूपात उपलब्ध का नाही?
प्रभाकर [बापू]

महत्वाचा लेख आााहे ा
पुर्ण आारामात वाचून कॉमेण्ट्स कराव्या लागतील।

क् + श = क्श = क्ष
ज् + ञ = ज्ञ

त्यामुळे क्रमीत जागा योग्यच नाही का?

सा् रे् ग् म् प् ध् नि् सा्

किरण, थोड्या उलटसुलट अर्ग्युमेण्ट्स मुळे कोणकोणते मुद्दे अजुनही अबाधीत आहेत ते कळत नाही Sad

देवनागरी लिपी संगणकावर कशी दिसावी अन त्यातील वापराबाबत असणार्‍या तृटींबद्दलची आपली कळकळ समजली.
आपल्या बर्‍याच मुद्यांशी सहमत आहे. (उदा. लिहीण्याबाबतचे स्वातंत्र्य, साहेब, तालूका आदी अक्षरे लघूलिपीत लिहीणे, पोर्टॅबीलीटी, प्रिंटींग आदी.)

या सध्याच्या प्रणालीमधील दोष दुर करणे हे सामान्य डेव्हलपरांच्या आवाक्याबाहेरचे काम आहे हे मान्य करावे लागते.

यावर एक उपाय होवू शकतो:

भारतात अनेक भाषा बोलल्या लिहील्या जातात. देवनागरी लिपीत बहूदा हिंदी, मराठी, भोजपुरी, राजस्थानी व अन्य भाषा लिहीता येत आहेत.

या प्रत्येक भाषेत लिहीण्याचे काही संकेत, व्याकरण आहे. त्यामुळे या सार्‍या भाषा केवळ संगणकासाठी वेगवेगळ्या मानल्या जाव्यात. त्या त्या भाषांचे ASCII, EBCDIC सारखे टेबल्स डेव्हलप केले जावेत. त्या त्या भाषांमध्ये किबोर्ड किज डेव्हलप केल्या जाव्यात.

अर्थातच मोठ्या सॉफ्टवेअर अ‍ॅप्लीकेशन्स डेव्हलप करणार्‍यांना यात रस असणार नाही हे उघड आहे. त्यामुळे आपण वरउल्लेखलेल्या नॉन प्रॉफीट ऑर्गनायझेशन्सना यात उतरावे लागेल. त्यातही एखादी स्वायत्त संस्था पुढाकार घेवू शकते. पण त्या संस्थेची मते, अहवाल इतरांनी मान्य करावे हा मुद्दा ठासून सांगीतला/ बाणवला गेला पाहीजे.

Technology Development for Indian Languages (TDIL) Programme initiated by the Department of Electronics & Information Technology (DeitY), Ministry of Communication & Information Technology (MC&IT), Govt. of India has the objective of developing Information Processing Tools and Techniques to facilitate human-machine interaction without language barrier; creating and accessing multilingual knowledge resources; and integrating them to develop innovative user products and services.

The Programme also promotes Language Technology standardization through active participation in International and national standardization bodies such as ISO, UNICODE, World-wide-Web consortium (W3C) and BIS (Bureau of Indian Standards) to ensure adequate representation of Indian languages in existing and future language technology standards.

http://tdil.mit.gov.in/

हे कार्यालय यासाठीच आहे आणि सरकारकडून त्यांना भरपूर पैसेही मिळतात. आणि त्यांनी खरोखर कामही केले आहे. विशेषतः भारतीय भाषांबद्दलचे प्रश्न W3C,UNICODE, ISO सारख्या आंतरराष्ट्रिय मानकांपर्यंत पोहोचवण्याचे काम करण्याची पात्रता आणि साधने दोन्ही इथे आहेत. काही बदल करायचे असतील तर इथून सुरु करा.

Pages