मराठीत ऑफलाईन टंकलेखन

Submitted by shantanuo on 11 September, 2018 - 09:51

गुगल इनपुट टूल्स वापरून ऑनलाईन टाइप करता येते.
https://www.google.com/inputtools/

पण मायक्रोसॉफ्ट वर्ड मध्ये टाईप करण्यासाठी त्याचा उपयोग नाही. भाषाइंडीया या साईटवरून डाऊनलोड केलेल्या इनपुट एडिटरचा अनुभव कसा आहे?
https://bhashaindia.com/downloads.aspx

यात स्पेल चेक / एटो करेक्ट नाही. तशी अपेक्षाही नाही कारण हे फक्त इनपुट टूल आहे. हा मजकूर मी याच टूलाचा वापरा करूंन वर्डमध्ये लिहिला आहे. मजकूर सेव्ह होण्यात काही अडचण (सध्या तरी) आलेली नाही. बरहाच्या आठवणीने अजूनही व्यथित होणार्या मंडळीनी वापरून बघायला हवे असे. ऑफलाईन टंकलेखन कारण्याकरता अजून काय मार्ग आहेत?

Group content visibility: 
Use group defaults

शंतनु, इतर बरेच सॉफ्टवेअर इन्स्टॉल्ड आहे.
तुम्ही तयार केलेली OS इन्स्टॉल करायची तर आधी सगळ्यांची यादी करून मग ते परत रिइंस्टॉल करावे लागले असते. नविन संगणक सेट अप करायचा तर तुमची OS खूप सोयीस्कर पडेल.

आपल्या मार्गदर्शनाबद्दल धन्यवाद! Happy

सफिक्स रूल वापरून डिक्शनरीतील शब्द वाढविण्याचा माझा नवीन प्रयत्न चालू आहे. उदाहरण म्हणून "मूल" हा शब्द पाहू. सध्या मूल या शब्दापासून होणारे पुष्कळसे शब्द एकेक करून या यादीत जमा केले आहेत. म्हणजे मुलाचा, मुलांची, मुलापासून वगैरे. आता अशा शब्दांची संख्या खूप असल्यामुळे सर्व शब्द नाही - पण वापरात असणारे शब्द आम्ही जमा केले.

जमेल तसे, जमेल तितके , मिळतील तिथून शब्द साठवण्याची ही पद्धत सदोष आहे. छंद म्हणून ठीक पण सायंटिफिक पद्धत वापरायची झाली तर सफिक्स रूल वापरावे लागतील. म्हणजे डिक्शनरीत फक्त ३ शब्द असतील.

मूल
मुला
मुलां

यात सर्वप्रथम मूळ शब्द, त्यानंतर एकवचनी व अनेकवचनी सामान्यरूपे. यापासून सफिक्स नियमाद्वारे ह्न्स्पेल इंजीन सर्व शब्द बनवेल. उदा....
मुलास, मुलाला, मुलाने, मुलाशी, मुलाहून, मुलाचा, मुलाची, मुलाचे, मुलात,
मुलांस, मुलांला, मुलांना, मुलांनी, मुलांशी, मुलांही, मुलांहून, मुलांचा, मुलांची, मुलांचे, मुलांत, मुलांनो

सफिक्स रूल हा असा लिहितात.

SFX ek Y 9
SFX ek 0 स .
SFX ek 0 ला .
SFX ek 0 ने .
SFX ek 0 शी .
SFX ek 0 हून .
SFX ek 0 चा .
SFX ek 0 ची .
SFX ek 0 चे .
SFX ek 0 त .

पहिल्या ओळीत आपण या एकवचनी सफिक्स रूलचे नामकरण करून त्याला 'ek’ असे म्हणू. हा लागू असल्याने 'Y’ आणि खाली दिलेल्या ९ ओळींपुरता मर्यादित. अशाच पद्धतीने १२ ओळींचा अनेकवचनी रूल लिहिला. त्यालाही काही नाव द्यावे लागेल. ते दिले 'an’

SFX an Y 12
SFX an 0 स .
SFX an 0 ला .
SFX an 0 ना .
SFX an 0 नी .
SFX an 0 शी .
SFX an 0 ही .
SFX an 0 हून .
SFX an 0 चा .
SFX an 0 ची .
SFX an 0 चे .
SFX an 0 त .
SFX an 0 नो .

आता हे दोन नियम कोणत्या शब्दांना लावायचे ते कसे कळावे? म्हणून...

मूल
मुला/ek
मुलां/an

प्रुफिंग टूल्स जी.यु. आय. या सॉफ्टवेसमध्ये हे शब्द कसे तयार होतील ते पाहता येते.

आता हे इतके सोपे असेल तर सर्व शब्द नियमात बसवायला काय अडचण आहे? मला मूळ शब्द व त्यांच्या सामान्यरुपांची यादी नेटवर कुठेही मिळाली नाही. म्हणजे ती यादी अशी दिसायला हवी...

मूल
मुला/ek
मुलां/an
घोडा
घोड्य़ा/ek
घोड्य़ां/an

ही पोस्ट वाचणाऱ्यांपैकी ज्यांना आस्था असेल त्यांनी शक्य होतील तितके शब्द टाईप करून माझ्याकडे पाठवले तर सर्वांनाच याचा फायदा होईल. ही यादी मुक्त स्त्रोत असेल, कोणालाही वापरता येईल आणि त्याचा काहीही मोबदला मिळणार नाही.

म्हणजे अशी यादी हवी आहे का?

चुल
चुला/ek
चुलीं/an

सफरचंद
सफरचंदा/ek
सफरचंदां/an
(सफरचंदात काय अपेक्षित आहे ते कळले नाही.)

तसेच नावे असल्यास कसे सफिक्स अपेक्षित आहे? म्हणजे उदा. अथेन्स हे नाव कसे केले पाहिजे?
अथेन्स
अथेन्सा/ek
अथेन्स/an
मुद्दाम हे घेतले कारण भारतीय किंवा महाराष्ट्रातील शहरांची नावे संभाषणानुसार बदलतात. म्हणजे 'नाशिक येथे द्राक्षे पिकतात' हेच 'नाशकात द्राक्षे खुप होतात'. असे ही बोलले आणि लिहिले जाते.
पण इतर बाह्य देशातील नावे मात्र सहसा वेगळी येतात. म्हणजे 'तो सध्या अथेन्सात रहायला गेला' असे 'सहसा' म्हणत नाही. मग ek आणि an दोन्ही अथेन्स राहतील का?

मग हे शब्द नियमात कसे बसवणे आवश्यक आहे?

बाकी अशी यादी बनवायला मी थोडीफार खारीची मदत करू शकेन.
तुम्ही शब्द दिले तर मी एक्सेलात काहातरी मॅक्रो जुगाड करून असे शब्द बनवता येतात का ते पाहतो.
(अन्यथा शब्द शोधायचीही तयारी आहे.)

>> हे कार्य करताना जर अनेकजण मदत करत असतील तर ...
अनेकजण मदत करतील अशी शक्यता फार कमी आहे. उदाहरणार्थ "किल्ली" या व्यक्तीने मदत करायची तयारी जाहीरपणे याच धाग्यात दाखविली. मी ई-मेल केला. पण त्यानंतर त्यांना वेळ मिळालेला दिसत नाही. फ्री आणि ओपन सोर्स सॉफ्टवेअरचे हेच दुखणे आहे आणि हेच बलस्थान देखील.

>> अक्षरे वाटून घ्यावीत किंवा दिली जावीत.
त्याची गरज नाही. प्रुफींग टूल्स जी.यू.आय. या सॉफ्टवेअरमध्ये इंपोर्ट, मर्ज, सॉर्ट, डि-ड्युप्लिकेशन या सर्व सोयी आहेत. ते कमी पडले तर पायथॉन स्क्रिप्ट लिहून सर्व शब्द एकत्र करायला कितीसा वेळ लागणार आहे? अक्षरे वाटली तर मर्यादा पडतील. तेच ते शब्द दोघा-तिघांनी पाठविले तरी चालेल.

>> तुम्ही शब्द दिले तर मी एक्सेलात काहातरी मॅक्रो जुगाड करून असे शब्द बनवता येतात का ते पाहतो.
पायथॉनमध्ये असे बरेच जुगाड करून थकल्यावर शेवटी मायबोलीवर मदतीसाठी आवाहन केले आहे. एक्सेल मॅक्रोचा काहीही फायदा होणार नाही.

>> मग ek आणि an दोन्ही अथेन्स राहतील का?
अथेंस हे शहराचे नाव असल्यामुळे त्याचे अनेकवचन होणार नाही आणि सामान्यरूपही तेच राहील. म्हणून माझ्यामते हे दोन शब्द डिक्शनरीत घेता येतील.
अथेंस
अथेंस/ek

पण "पुणे" शब्दाचे सामान्यरूप "पुण्या" (पुण्यात, पुण्याचे, पुण्याची) असे होईल.
पुणे
पुण्या/ek

या दोन शहरात एक मुलभूत फरक हा आहे की सामान्य मराठी माणसाच्या लिहिण्यात "अथेंस" विशेष येत नाही. बरोबर? मग तो शब्द डिक्शनरीत घेऊन उगाच साईज का वाढवा? कोणता शब्द घ्यायचा व कोणता नाही याचा निर्णय मी (आम्ही - स्वयंसेवक मिळून) तारतम्याने घेत आलो आहोत. इंग्रजीत ज्याप्रमाणे en-uk आणि en-us अशा दोन डिक्शनरी आहेत त्याप्रमाणे मराठीत अधिक सर्वसमावेशक स्पेल चेक कुणी बनविला तर स्वागत आहे.

>> म्हणजे 'नाशिक येथे द्राक्षे पिकतात' हेच'नाशकात द्राक्षे खुप होतात'. असे ही बोलले आणि लिहिले जाते.
बोलले जाते हे माहीत होते. लिहीले जाते या विषयी शंका होती. गूगलमध्ये पाहिले तर सकाळ, लोकमत यासारख्या वृत्तपत्रांत "नाशकात" शब्द दिसत आहे तेव्हा तो डिक्शनरीत घेता येईल.

नाशिक
नाशिक/ek
नाशका/ek

पण यात रिस्क अशी आहे की यामुळे "नासलेला" या शब्दाला "नाशकाला" असा पर्यायी शब्द दिसू शकतो. म्हणून बोली भाषेतील सामान्यरूपे घेऊ नयेत. (माझ्या मते)

नाशिक
नाशिक/ek

तांत्रिक मुद्द्यावर नाशका/ek ही नोंद खारीज होत असली तरी ही काही दगडावरची रेघ नाही. चूल, सफरचंद या शब्दांत काय अपेक्षित आहे हे मला देखील खात्रीने सांगता येणार नाही. अनुभवी व्यक्तींचे मार्गदर्शन अपेक्षित. ज्यांना संगणक हाताळता येत नाही त्यांनी वरील नियमात बसणारे शब्द कागदावर लिहून पोस्टाने माझ्याकडे पाठविले तरी चालेल.

"नासलेला" या शब्दाला "नाशकाला" असा पर्यायी शब्द दिसू शकतो.

हे तर व्हायला नको!
तसेच डेटाबेस ची साईज वाढल्याने काय तोटा आहे? उलट येतील तेव्हढे सर्व शब्द सामाविष्ट करावेत अशा मताचा मी आहे.
असो.
शब्दांचा एक नमुना आज उद्याकडे चिकटवण्याचा प्रयत्न करेन.

वर लिहिल्या प्रमाणे अ अक्षराचे काही शब्द देत आहे.

--
अक्षरा
अक्षरा /ek
अक्षरां /an

अनाथ
अनाथा /ek
अनाथां /an

अनर्थ
अनर्था /ek
अनर्थां /an

अपघात
अपघाता /ek
अपघातां /an

अपेक्षा
अपेक्षां /an

अतृप्त
अतृप्ता /ek
अतृप्तां /an

अपेक्षाभंग
अपेक्षाभंगा /ek
अपेक्षाभंगां /an

अभिवादन
अभिवादना /ek
अभिवादनां /an

अभिवचन
अभिवचना /ek
अभिवचनां /an

अभिनंदन
अभिनंदना /ek
अभिनंदनां /an

अभिनेता
अभिनेत्या /ek
अभिनेत्यां /an

अरण्य
अरण्या /ek
अरण्यां /an

अवर्षण
अवर्षणा /ek
अवर्षणां /an

अडचण
अडचणी /ek
अडचणीं /an

अभ्यास
अभ्यासा /ek
अभ्यासां /an

अन्न
अन्ना /ek
अन्नां /an

अण्णा
अण्णां /an

अग्नी
अग्नीं /an

अचल
अचला /ek
अचलां /an

अचंबा
अचंब्या /ek
अचंब्यां /an

अतिथी
अतिथ्या /ek
अतिथीं /an

अत्याचार
अत्याचारा /ek
अत्याचारां /an

अपराध
अपराधा /ek
अपराधां /an

अपमान
अपमाना /ek
अपमानां /an

अपाय
अपाया /ek
अपायां /an

अश्रू
अश्रूं /an

अंबर
अंबरा /ek
अंबरां /an

अमृत
अमृता /ek
अमृतां /an

अंक
अंकां /ek
अंकां /an

अद्ययावत
अद्ययावता /ek
अद्ययावतां /an

अद्यतन
अद्यतना /ek
अद्यतनां /an

अध्यासन
अध्यासना /ek
अध्यासनां /an

अघोर
अघोरा /ek
अघोरां /an

अट
अटी /ek
अटीं /an

अटतटी
अटतटीं /an

अगणित
अगणिता /ek
अगणितां /an

असंख्य
असंख्या /ek
असंख्यां /an

अजय
अजया /ek

अजेय
अजेया /ek
अजेयां /an

अभाव
अभावा /ek
अभावां /an

अदृश्य
अदृश्या /ek
अदृश्यां /an

अद्वितीय
अद्वितीया /ek
अद्वितीयां /an

अचपल
अचपला /ek
अचपलां /an

अपंग
अपंगा /ek
अपंगां /an

अहवाल
अहवाला /ek
अहवालां /an

अंगठा
अंगठ्या /ek
अंगठ्यां /an

अंग
अंगा /ek
अंगां /an

अडाणी
अडाण्या /ek
अडाण्यां /an

अकर्म
अकर्मा /ek
अकर्मां /an

अखंड
अखंडा /ek
अखंडां /an

अगोचर
अगोचरा /ek
अगोचरां /an

अचूक
अचूका /ek
अचूकां /an

अचेतन
अचेतना /ek
अचेतनां /an

अचैतन्य
अचैतन्या /ek
अचैतन्यां /an

अच्युत
अच्युता /ek
अच्युतां /an

अज
अजा /ek
अजां /an

अजर
अजरा /ek
अजरां /an

अजरामर
अजरामरा /ek
अजरामरां /an

अजाण
अजाणा /ek
अजाणां /an

अजाणता
अजाणत्या /ek
अजाणत्यां /an

अजात
अजाता /ek
अजातां /an

अजिंक्य
अजिंक्यां /ek
अजिंक्यां /an

अजीर्ण
अजीर्णा /ek
अजीर्णां /an

अटळ
अटळा /ek
अटळां /an

अढळ
अढळा /ek
अढळां /an

अतर्क्य
अतर्क्या /ek
अतर्क्यां /an

अतुलनीय
अतुलनीया /ek
अतुलनीयां /an

अतुष्ट
अतुष्टा /ek
अतुष्टां /an

अतुल्य
अतुल्या /ek
अतुल्यां /an

अतूट
अतूटा /ek
अतूटां /an

अतृप्त
अतृप्ता /ek
अतृप्तां /an

अद्वितीय
अद्वितीया /ek
अद्वितीयां /an

अद्वैत
अद्वैता /ek
अद्वैतां /an

अद्वैतभाव
अद्वैतभावा /ek
अद्वैतभावां /an

अद्वैतवाद
अद्वैतवादा /ek
अद्वैतवादां /an

अधम
अधमा /ek
अधमां /an

अधर्म
अधर्मा /ek
अधर्मां /an

अधार्मिक
अधार्मिका /ek
अधार्मिकां /an

अधीर
अधीरा /ek
अधीरां /an

अनित्य
अनित्या /ek
अनित्यां /an

अनियंत्रित
अनियंत्रिता /ek
अनियंत्रितां /an

अनिश्चित
अनिश्चिता /ek
अनिश्चितां /an

अनिष्ट
अनिष्टा /ek
अनिष्टां /an

अपरिचित
अपरिचिता /ek
अपरिचितां /an

अपरिणीत
अपरिणीता /ek
अपरिणीतां /an

१) सर्वप्रथम आपल्या सहकार्याबद्दल धन्यवाद.
२) यापुढे मात्र इ-मेलने संपर्क करावा. सर्वच वाचकांना यापुढील चर्चेत रस असेल असे नाही. विषय निघाला आहे म्हणून माझ्या प्रतिक्रिया खाली देत आहे.

अ) काही शब्द शब्दकोशांपुरतेच मर्यादित असतात. त्यांचा प्रत्यक्षात वापर फार कमी होतो. असे शब्द घेऊ नयेत. कारणे दोन. १) डेटाबेसचा आकार मर्यादित ठेवला नाही तर स्पेल चेकर स्लो होईल. २) हे शब्द सुचवणीत अस्थानी दिसतील. उदा. अजांना हा शब्द टेक्निकली बरोबर असला तरी वापरला जात नाही. आणि तो इतर शब्दांना सुचविला गेला तर त्याला अर्थ नाही. खालील शब्दांचा फेरविचार व्हावा ही विनंती.

अटतटी
अटतटीं /an

अज
अजा /ek
अजां /an

ब) खाली दिलेले शब्द आपण त्यांच्या अनेकवचनी रूपांसह घेतले आहेत. "अद्वितीयांस" असा शब्द असलेली किती वाक्ये बनतील? गुगल हे काही प्रमाण नव्हे पण त्यात जर त्या शब्दाचे एकही पान दिसत नसेल तर तो शब्द आपण कोणीच वापरत नाही असे म्हणायला जागा आहे.

अजीर्ण
अटळ
अढळ
अतुलनीय
अद्वितीय
अमृत

अभ्यासक / विद्वान यांच्या प्रबंधात असे काही अनेकवचनी शब्द असू शकतात. पण हा प्रोजेक्ट "कॉमन मॅन" साठी आहे. माझ्यामते हे शब्द एकवचनी वापरले जातात. काही शब्दांना तर विभक्ती प्रत्ययही लागत नाहीत.

क) काही शब्दांचे अनेकवचनी रूप बनते पण ते फक्त 'ना’, 'नो' अशा ठरावीक प्रत्ययांपुरते मर्यादित असते. अशा केसेस करता नवीन रूल बनवावा लागेल.

SFX an2 Y 1
SFX an2 0 ना .

शब्दांची जी रूपे आपण हे रूल वापरून बनवीत आहात त्यांचा प्रत्यक्षात वापर होत आहे का हा महत्त्वाचा मुद्दा आपण विचारात घेतलेला दिसत नाही.

>> नियमात SFX an 0 ला . हे काही शब्दांना व्यवस्थित बसतेय असे वाटत नाही...

तसे असेल तर नवीन सफिक्स रूल (तुम्हीच) लिहायचा आहे. इंग्रजीतील अनेकवचनी शब्द कसे बनविले जातात ते येथे वाचता येईल.

उदाहरण म्हणून आपण हा रूल पाहू…

SFX ek1 Y 4
SFX ek1 डा ड्याचा डा
SFX ek1 डा ड्याची डा
SFX ek1 डा ड्याचे डा
SFX ek1 डा ड्याच्या डा

या सफिक्स रूलमध्ये ५ कॉलम आहेत. पहिले दोन कॉलम आपल्या परिचयाचे आहेत. पाचवा कॉलम म्हणतो,
शब्दाच्या शेवटी “डा” असलेल्या शब्दांना हा नियम लागू आहे. तिसरा कॉलम म्हणतो की शेवटचा "डा" काढून टाका आणि त्याला (चौथ्या कॉलममध्ये दाखविलेला) "ड्याचा" असा जोड द्या.

थोडक्यात तिसऱ्या स्तंभात असलेले "डा" हे अक्षर काढून त्याच्या जागी चौथ्या स्तंभात असलेले अक्षर जोडायचे आहे.

घोडा - "डा" = घो

घो + "ड्याचा" = घोड्याचा

अशा पद्धतीने चार शब्द बनतील घोड्याचा, घोड्याची, घोड्याचे, घोड्याच्या आणि डिक्शनरीत नोंद होईल ती अशीः

घोडा
घोडा/ek1

सध्या तरी आपण फक्त मी १४ ऑक्टोबर या दिवशी पोस्ट केलेले २ सफिक्स रूल वापरू. कारण वर दिलेल्या पद्धतीने बनविलेले रूल्स इतके क्लिष्ट बनतील की ते वापरणे / बदलणे कठीण होईल. स्वतंत्रपणे सफिक्स रूल लिहिण्याइतके तज्ञ मिळाले की हा स्पेल चेक अधिक उपयोगी होईल हे नक्कीच.

नवीन सफिक्स रूल (तुम्हीच) लिहायचा आहे.

काय शंतनुराव तुम्ही हे सांगायचे ना!
ठिकाय. आता तसे करू.
ते साधन उतरवले आहे. पण कसे वापरायचे ते पाहायला वेळ झाला नाही.

शब्द हवे तर विपत्रातून पाठवू पण चर्चा इथेच झाली तर बरे.
कुणाला तरी यात रस असेलच...

आत्ता नसेल तर नंतर कधीतरी असेल.
हा विषय गुगल वर सर्च करताना सापडेल.
कदाचित मायबोली वर स्पेलचेल उपलब्ध करून देता येईल वगैरे वगैरे.
तेव्हा इतरांना रस आहे की नाही याची काळजी नको.
ज्यांना रस नाही ते आपल्याकडे दुर्लक्ष्य करतील.

-सध्या तरी आपण फक्त मी १४ ऑक्टोबर या दिवशी पोस्ट केलेले २ सफिक्स रूल वापरू. -
चालेल.

कुणाला तरी यात रस असेलच...
आत्ता नसेल तर नंतर कधीतरी असेल.
>>>
+१ चर्चा इथेच करावी आणि जे कोणी शब्द विपत्राने पाठवतील, त्यांनी ते पाठवल्याचे इथे आवर्जून लिहावे. इतरांना प्रोत्साहन मिळेल.

आ अक्षरपासून होणारे शब्द देत आहे.
क्षमस्व विपत्र करता आले नाही.

बरोबर आहेत का ते कळवावे.

आंध्र
आंध्रा/ek

आइसलँड
आइसलँड/ek

आई
आई/ek
आईं/an

आकर्षण
आकर्षणा/ek
आकर्षणां/en

आकार
आकारा/ek
आकारां/en

आकाश
आकाशा/ek

आग
आगी/ek
आगीं/en

आग्रा
आग्र्या/ek

आठ
आठा/ek
आठां/en

आदिवासी
आदिवासी/ek
आदिवासी/en

आनंद
आनंदा/ek

आभार
आभारा/ek
आभारां/en

आम्ल
आम्ला/ek
आम्लां/en

आम्लपित्त
आम्लपित्ता/ek

आयर्लंड
आयर्लंडा/ek
आयर्लंडां/en

आयुर्वेद
आयुर्वेदा/ek
आयुर्वेदां/en

आराध्यदैवत
आराध्यदैवता/ek
आराध्यतातां/en

आरोग्य
आरोग्या/ek

आर्जेन्टिना
आर्जेन्टिना/ek

आर्मेनिया
आर्मेनिया/ek

आले
आल्या/ek
आल्या/en

आल्बेनिया
आल्बेनिया/ek

आवाज
आवाजा/ek
आवाजां/en

आवार
आवारा/ek
आवारां/en

आशा
आशा/ek
आशां/en

आशिया
आशिया/ek

आश्चर्य
आश्चर्या/ek
आश्चर्यां/en

आसन
आसना/ek
आसनां/en

आसाम 
आसामा/ek

आहार
आहारा/ek
आहारा/en

आहारशास्त्र
आहारशास्त्रा/ek
आहारशास्त्रा/en

वर शंतनुने दिलेया सफिक्स नियमात यादीतील शब्द व्यवस्थित बसतात का हे कुणी तरी कृपया पाहील का?
काम करताना चुका होऊ शकतात.

आसाम
आसाम/ek असे हवे.

तसेच आश्चर्य / अचंबा / आशा यांच्या अनेकवाचनाची गरज नाही, वापरल्याजाण्याची शक्यता जवळजवळ शून्य.

आशा
आशे/ek असे हवे.

आले, आयुर्वेद, आयर्लंड यांचे अनेकवचन होणार नाही त्यांचा /en नियम काढून टाकायला हवा.

आहार
आहारा/ek
आहारांं/en

आहारशास्त्र
आहारशास्त्रा/ek
आहारशास्त्रां/en

इ आणि इं ने सुरू होणारे शब्द

इंग्रजी
इंग्रजी/ek
इंग्रजी/en

इंग्रज
इंग्रजा/ek
इंग्रजां/en

इंच
इंचा/ek
इंचां/en

इंजिन
इंजिना/ek
इंजिनां/en

इंडोनेशिया

इंद्र
इंद्रा/ek
इंद्रां/en

इंद्राणी
इंद्राणी/ek

इक्वेडोर
इक्वेडोर/ek

इच्छा
इच्छा/ek
इच्छां/en

इच्छित
इच्छिता/ek
इच्छितां/en

इजिप्त
इजिप्त/ek

इटली
इटली/ek

इटानगर
इटानगरा/ek

इतर
इतरा/ek
इतरां/en

इतिहास
इतिहासा/ek
इतिहासां/en

इथियोपिया
इथियोपिया/ek

इन्स्ट्रुमेंट
इन्स्ट्रुमेंटा/ek
इन्स्ट्रुमेंटां/en

इराक
इराक/ek

इराण
इराण/ek

इरिट्रिया
इरिट्रिया/ek

इष्ट
इष्टा/ek
इष्टां/en

इस्रायल
इस्रायल/ek

आज संगणकातील कचरा (नको असलेल्या फाईल्स) साफ करताना हे सोने (Google IME Tool setup) मिळाले!!!
Google IME Tool हे एक उत्तम software आहे. Google Chrome सारखे browsers, Microsoft Word/Excel/Powerpoint, Paint यासारख्या कोणत्याही software मध्ये offline मराठी टंकलेखन करता येते!

https://goo.gl/dym85c

"विक्षिप्त_मुलगा" यांनी कचऱ्यातून काढलेले सोने नक्की सोनेच आहे का याची खात्री करून घ्यावी. कारण ते सॉफ्टवेअर इंस्टॉल होत नाहीये. बराह आणि गुगल आय.एम.ई हे अनेकांचे "पहिले प्रेम" असल्यामुळे त्यातून त्यांना अजूनही बाहेर पडता येत नसावे असे वाटते.
_____

कोणते शब्द घ्यावेत व ते नियमात कसे बसवावे या बाबत अजूनही काही शंका असाव्यात असे वाटते. म्हणून "मराठी लेखन कोश" या पुस्तकातील पान ५ पाहू.

या पानावर उदाहरण म्हणून दिलेले शब्द हंस्पेल नियमात असे बसतील…

गुढी/ek
गुढ्या
गुढ्यां/an
दगड
दगडा/ek
दगडां/an
तराजू/ek
तराजूं/an
दासी/ek
दासीं/an
थरकाप
थरकापा/ek
कोय
कोई/ek
कोयी/ek
कोई
कोयी
कोईं/an
कोयीं/an
द्रव्य
द्रव्या/ek
द्रव्ये
द्रव्यां/an
बाकी/ek
बाक्या
बाक्यां/an

यात लक्षात घेण्याची गोष्ट अशी की दगड शब्दाचे एकवचनी सामान्यरूप मूळ शब्दापेक्षा वेगळे असल्यामुळे त्याच्या ३ नोंदी होतील तर दासी शब्दाच्या फक्त २ नोंदी पुरेश्या आहेत.

दगड
दगडा/ek
दगडां/an

दासी/ek
दासीं/an

कारण ते सॉफ्टवेअर इंस्टॉल होत नाहीये. .......

घोर निराशा!!! मला वाटले माझ्याकडे आधीच install असल्याने 'कोणतेही अद्यतन उपलब्ध नाही' (No update available) असे दिसते आहे.

मायबोलीकर, क्षमस्व!

हंस्पेल पॅकेज वापरून शब्दाचा उलट प्रवासही शक्य होतो. म्हणजे "घोड्य़ाचा" असा शब्द दिला की त्याचे मूळ रूप म्हणजे "घोडा" हा शब्द आपण या पानावर दिलेला ४ ओळींचा पायथॉन कोड वापरून मिळवू शकतो. याचा अर्थ "घोड्याचा युद्धात उपयोग होतो.” हे वाक्य कंप्युटर "घोडा + युद्ध" अशा अर्थाने घेईल व घोड्याचा युद्धाशी संबंध जोडेल. ह्याला NLP (एन. एल. पी.) "नॅचरल लँग्वेज प्रोसेसिंग" म्हणतात. इंग्रजीतील nltk, spacy, gensim या तंत्रांनी खूप मोठी उंची गाठली आहे. मराठीविषयी काही न बोललेलेच चांगले.
एन.एल.पी. वापरून कंप्युटर जे शिकतो ते फार प्राथमिक दर्जाचे असते. म्हणजे "भिकू म्हात्रेने घोड्याचा चाप दाबला.” हे वाक्य आपल्यापैकी अनेकांना समजेल तर काहींना समजणार नाही तर कंप्युटरला कसे कळावे? कारण यात घोडा शब्द बंदूक या अर्थाने वापरला आहे आणि त्याला "सत्या" या चित्रपटाचा संदर्भ आहे. सध्याच्या संगणकाने हे देखील गेल्या ४ – ५ वर्षात साध्य केले आहे त्याला म्हणतात आर्टीफिशीयल इंटलिजंस (AI – Artificial Intelligence ) काही वाचकांना सहज समजणारे संदर्भ कॉम्प्युटरला शिकवण्या करता गेली कित्येक वर्षे शेकडो तज्ज्ञ काम करत आहेत हे जाता जाता नमूद करावेसे वाटते. शिकवण्याच्या या क्लासला दोन गोष्टी लागतात. १) भरपूर डेटा आणि २) डेटा प्रोसेस करण्याकरता पॅकेजेस. वर उल्लेख केलेली nltk, spacy, gensim यासारखी पॅकेजेस थोड्याफार बदलानंतर मराठीसाठी देखील वापरता येतील. पण डेटा कुठून आणणार? मराठी विकिपीडिया हा मोठा आधार आहे, पण त्यातही फार मोठे लेख नाहीत. मराठी ब्लॉगविश्व सध्या मृतवत आहे. १० वर्षांनंतर देखील युनिकोडचा पूर्णपणे स्वीकार झालेला नाही. जे थोडेफार लेखन आहे ते कॉपीराईटच्या जाळ्यात अडकलेले आहे.
फक्त मराठीच नव्हे तर जगातील बहुतेक भाषांचे भवितव्य आता ते भाषिक तंत्रज्ञानाचा स्वीकार किती वेगाने करतात यावर अवलंबून असणार आहे.

डेटा कुठून आणणा>> खरय, स्रोताअभावी सगळ डेव आणि टेस्ट नहि करत येणार
एक शन्का: synthetic data generate करुन सुरु वातीला primary training model develop and test करता येइल का?
अर्थात ते कित्पत अचुक असेल ते नाही सन्गता येनार

हिंदीत मराठीसारखे विभक्ती प्रत्यय नसल्यामुळे त्यातील सफिक्स रूल्स अगदी सोपे आहेत. ते येथे पाहता येतील. उदाहरण म्हणून 'N' आणि 'O' या नावाचे हे दोन रूल्स पाहू.

SFX N Y 2
SFX N ी ियाँ ी
SFX N ी िओं ी

SFX O Y 3
SFX O ी िओं ी
SFX O ई इओं ई
SFX O ई इयाँ ई

हे रूल्स खाली दिलेले तीन शब्द वापरत आहेत असे समजू.

कली/N
भाई/O
धोबी/O

कली शब्दापासून दोन शब्द (कलियाँ, कलिओं) भाई शब्दापासून दोन (भाइओं, भाइयाँ) पण धोबी शब्दापासून फक्त एक शब्द बनतो. (धोबिओं)

सफिक्स रुल्ससारखे प्रिफीक्स रुल्सदेखील वापरता येतील. मुख्यमंत्री, प्रधानमंत्री, अर्थमंत्री असे शब्द b आणि & हे दोन रूल वापरून बनवता येतील. "अर्थ" प्रिफिक्स वरच्या b रुलमध्ये न टाकता त्याचा स्वतंत्र रूल का बनविला? त्याचे कारण अर्थ शब्दाने इतर काही शब्द (अर्थशास्त्र, अर्थचिंता) बनतात त्यांच्या मुख्य वा प्रधान शब्दांशी काही संबंध नाही. म्हणून हे दोन रूल वेगवेगळे हवेत.

PFX b Y 4
PFX b 0 मुख्य .
PFX b 0 प्रधान .
PFX b 0 महा .
PFX b 0 उप .

PFX & Y 1
PFX & 0 अर्थ .

डिक्शनरीतील नोंदः
मंत्री/&b
मन्त्री/&b
चिंता/@m=&
शास्त्र/`&

प्रत्येक रूल व त्यात बसणारे शब्द ही पायथॉन स्क्रिप्ट वापरून अभ्यासता येतील.
_____

synthetic data generate करण्याची "किल्ली" यांची सूचना आहे. असे आभासी साहित्य निर्माण करणे सोपे नाही. व तसे करून फायदा नाही कारण त्यावर बनलेले मॉडेल तितकेसे विश्वासार्ह नसेल.
सिंथेटिक डेटा तयार करण्यासाठी देखील हंस्पेल रूल बनविणे आणि डिक्शनरीतील शब्द टॅग करणे जरुरी आहे.

"बसणे" या क्रियापदापासून खाली दाखविलेले सुमारे ८५ शब्द हंस्पेल रूल वापरून तयार केले आहेत. या प्रकाराला पूर्वी माझा मुख्य आक्षेप हा होता की असे "तयार केलेले" शब्द लोकांच्या लिहण्या/ बोलण्यात नसतात, तेव्हा ते डिक्शनरीत घेऊ नयेत. पण हे शब्द पाहिल्यावर लक्षात आले की यातील बहुतेक सर्व शब्द आपण कधी ना कधी वापरले आहेत. काही शब्द बोली भाषेत वापरलेले पाहिले आहेत. त्यामुळे हे रूल स्वीकारण्यास काहीच हरकत नसावी.

बस
बसण्या
बसण्याच
बसण्याचा
बसण्याची
बसण्याचे
बसण्यात
बसण्यानंतर
बसण्याने
बसण्यामागे
बसण्याला
बसण्यावर
बसण्याशी
बसण्यास
बसण्यासाठी
बसण्याही
बसण्याहून
बसलेल्या
बसलेल्यां
बसलेल्यांच
बसलेल्यांचा
बसलेल्यांची
बसलेल्यांचे
बसलेल्यांत
बसलेल्यांनंतर
बसलेल्यांना
बसलेल्यांनी
बसलेल्यांनो
बसलेल्यांमागे
बसलेल्यांला
बसलेल्यांवर
बसलेल्यांशी
बसलेल्यांस
बसलेल्यांसाठी
बसलेल्यांही
बसलेल्यांहून
बसलेल्याच
बसलेल्याचा
बसलेल्याची
बसलेल्याचे
बसलेल्यात
बसलेल्यानंतर
बसलेल्याने
बसलेल्यामागे
बसलेल्याला
बसलेल्यावर
बसलेल्याशी
बसलेल्यास
बसलेल्यासाठी
बसलेल्याही
बसलेल्याहून
बसल्या
बसल्यां
बसल्यांच
बसल्यांचा
बसल्यांची
बसल्यांचे
बसल्यांत
बसल्यांनंतर
बसल्यांना
बसल्यांनी
बसल्यांनो
बसल्यांमागे
बसल्यांला
बसल्यांवर
बसल्यांशी
बसल्यांस
बसल्यांसाठी
बसल्यांही
बसल्यांहून
बसल्याच
बसल्याचा
बसल्याची
बसल्याचे
बसल्यात
बसल्यानंतर
बसल्याने
बसल्यामागे
बसल्याला
बसल्यावर
बसल्याशी
बसल्यास
बसल्यासाठी
बसल्याही
बसल्याहून

या सर्व शब्दांना "च" आणि "ही" वापरून ८५ * ३ = २५५ शब्द बनविता येतील. पण तसे करण्यात अर्थ नाही. कारण आपण स्पेल-चेकमध्ये राईट क्लिकवर फार तर ५ – ६ शब्द दाखवू शकतो. त्यात सर्वात योग्य शब्द प्रथम दिसला पाहिजे आणि त्यासाठी डिक्शनरीचा आकार प्रमाणात ठेवावा.

# cat mr_IN3.aff

SFX P Y 5
SFX P 0 ण्या/QeZ .
SFX P 0 ल्या/QeZ .
SFX P 0 ल्यां/QaZ .
SFX P 0 लेल्या/QeZ .
SFX P 0 लेल्यां/QaZ .

SFX Q Y 4
SFX Q 0 साठी .
SFX Q 0 नंतर .
SFX Q 0 वर .
SFX Q 0 मागे .

SFX Z Y 2
SFX Z 0 च .
SFX Z 0 ही .

SFX e Y 9
SFX e 0 स .
SFX e 0 ला .
SFX e 0 ने .
SFX e 0 शी .
SFX e 0 हून .
SFX e 0 चा .
SFX e 0 ची .
SFX e 0 चे .
SFX e 0 त .

SFX a Y 12
SFX a 0 स .
SFX a 0 ला .
SFX a 0 ना .
SFX a 0 नी .
SFX a 0 शी .
SFX a 0 ही .
SFX a 0 हून .
SFX a 0 चा .
SFX a 0 ची .
SFX a 0 चे .
SFX a 0 त .
SFX a 0 नो .

अनेकवचनी e आणि एकवचनी a हे दोन रूल आपण पूर्वी पाहिले आणि वापरले आहेत. P, Q आणि Z हे तीन रूल नवीन आहेत. ते समजून घेण्याकरता डिक्शनरीत टॅग केलेला शब्द कसा दिसेल ते पाहू.
cat mr_IN3.dic
1
बस/P
“बस" या शब्दाला P हा टॅग लावल्यामुळे "बसल्या" , “बसलेल्या" असे शब्द तयार होतात. आता "ल्या" या सफिक्सला Q आणि Z चे शेपूट लावले आहे, त्यामुळे "बसल्यावर", “बसलेल्यांसाठी" असे शब्द तयार झाले. त्याचबरोबर "बसल्याच" आणि "बसलेल्याही" असे शब्द देखील मिळाले. “बसच" आणि "बसही" असे दोन शब्द हवे असतील तर डिक्शनरीतील नोंद थोडी बदलावी लागेल. ती अशी दिसेल.

बस/PZ
अशा प्रकारे डिक्शनरीतील टॅग केलेले शब्द आणि अफिक्स/ सफिक्स रूल्स एकदमच डेव्हलप करावे लागतील असे दिसते.

मस्त माहिती शन्तनूजी, मी हा धागा नियमीत वाचते..
रोचक आहे,
एक मात्र खरं की कामाचा आवाका खुप मोठा आहे ह्या प्रकल्पामध्ये..
एकदा डीटेल मध्ये अभ्यासाव लागणार हे प्रकरण

राम ह्या शब्दाचे सामान्यरूप "रामा" आणि अनेकवचनी सामान्यरूप "रामां" असे होईल. त्या शब्दांना "चा, ची , चे" असे विभक्ती प्रत्यय लागून पुढचे सर्व शब्द बनतात. त्यासाठी "आ" आणि "आं" असे दोन सफिक्स रुल आवश्यक आहेत. यातील पहिला एकवचनी "e" तर दुसरा बहुवचनी "a" या रुलपर्यंत घेऊन जातो. हे जे "नेस्टींग" आहे ते हंस्पेल इंजिनचे बलस्थान आहे. आपण या वैशिष्ट्यपूर्ण रूलला "F" असे नाव देवूया.

SFX F Y 2
SFX F 0 ा/e .
SFX F 0 ां/a .

डि्शनरीतील नोंदः
राम/F
बाळ/F
हाल/F

बाळ शब्दापासून तयार होणारे शब्दः
बाळ
बाळा
बाळाचा
बाळाची
बाळाचे
बाळात
बाळाने
बाळाला
बाळाशी
बाळास
बाळाहून
बाळां
बाळांचा
बाळांची
बाळांचे
बाळांत
बाळांना
बाळांनी
बाळांनो
बाळांला
बाळांशी
बाळांस
बाळांही
बाळांहून

तयार शब्दापासून मूळ शब्द देखील मिळवता येतो. याला आपण शब्दांचे "रिव्हर्स इंजिनिअरींग" म्हणू. त्यासाठी पायथॉन कोडः
import hunspell
hobj = hunspell.HunSpell('mr_IN3.dic', 'mr_IN3.aff')
for x in hobj.stem('बाळांशी'):
print (x.decode('utf-8')) ## बाळ

मराठीतील नियम क्रमांक ८.१ हा दीर्घोपान्त्य शब्दांना लागू होतो. हा नियम आपण हंस्पेल रूलमध्ये बसवूया.

नियम ८:
८.१उपान्त्य दीर्घ ई-ऊ असलेल्या मराठी शब्दांचा उपान्त्य ई-कार किंवा ऊ-कार उभयवचनी सामान्यरूपाच्या वेळी ऱ्हस्व लिहावा.
उदाहरणार्थः गरीब - गरिबाला; चूल - चुलीला, चुलींना;
अपवाद - दीर्घोपान्त्य तत्सम शब्द.
उदाहरणार्थ: परीक्षा - परीक्षेला, परीक्षांना; दूत - दूताला, दूतांना.
यातील दूत हा शब्द राम या शब्दासारखा चालेल. म्हणून त्याला तोच टॅग देता येईल.
राम/F
दूत/F

पण चूल, मूल या शब्दांसाठी हा रूल बनवला.

SFX H Y 4
SFX H ूल ुला/QZe ूल
SFX H ूल ुलां/QZa ूल
SFX H ीब िबा/QZe ीब
SFX H ीब िबां/QZa ीब

यातील पहिला रूल "चूल" शब्दाला तर दुसरा रूल "गरीब" शब्दाला लागू होतो. ८.१ या नियमात बसणारे शब्द मिळतील तसे H हा रूल वाढत जाईल. त्याला इलाज नाही. नेमका उपान्त्य ईकार /ऊकार रेग्युलर एक्स्प्रेशन वापरून निवडता येईलही पण त्यात बदल करणे शक्य होईल की नाही हे इतर तज्ज्ञ सांगू शकतील. तोवर वर दिलेली पद्धत वापरावी लागेल.

गरीब/H
मूल/H
चूल/H

वर दिलेल्या नियमात एक चूक आहे. ती म्हणजे चूल शब्दाचे सामान्यरूप "चुला" असे न होता "चुली" झाले पाहिजे पण "मूल" शब्दाचे सामान्यरूप "मुला" असे होईल. तर दूत शब्दाचे "दूता" असे. थोडक्यात दूत, चूल आणि मूल हे तीनही शब्द वेगवेगळ्या पद्धतीने चालतात आणि त्यांचे सामान्यरूप बनविण्यासाठी वेगवेगळे रूल्स लिहावे लागतील. हे टेक्निकली आणि प्रॅक्टिकली शक्य नाही. सामान्यरूपाला प्रत्यय लावल्यावर त्याचेही सामान्य रूप करायचे आहे. म्हणजे "मूल" या शब्दावरून "मुलामागे" आणि पुढे "मुलामागचा" हे दोन शब्द हंस्पेल कसे तयार करेल? यासाठी एक पाऊल मागे जाऊन सुरुवातीला जो ऍप्रोच ठेवला होता तसा ठेवावा लागेल. म्हणजे डिक्शनरीत २ (किंवा ३) शब्द सामान्यरूपासह ठेवावे.
मूल
मुला/e
मुलां/a

डिक्शनरीत फक्त एक मूळ शब्द ठेवून बाकी सर्व शब्द प्रोग्रॅमॅटिकली तयार करण्याचे माझे स्वप्न हे स्वप्नच राहणार असे दिसते. कदाचित या सर्व कारणांमुळे अजून कोणी मराठी हंस्पेल रूल बनविण्याच्या भानगडीत पडलेला नसावा. मराठी भाषा (मराठी माणसांप्रमाणेच) नियमात बसविणे कठीण आहे हे सप्रमाण सिद्ध झाले. Happy

बरेचसे विभक्ती प्रत्यय एकवचन व बहुवचन असे दोन्हीकडे असल्यामुळे त्यांना वेगळे काढून c असे नाव दिले. 'ने' हा प्रत्यय फक्त एकवचनात दिसतो म्हणून त्याला a नाव दिले तर 'नो’, 'ना’, 'नी' फक्त बहुवचनात म्हणून त्यांच्या ग्रुपला b असे नाव दिले. टॅग करताना कॉमन + एकवचनी किंवा कॉमन + बहुवचनी असा टॅग जोडावा लागेल. म्हणजे 'मूल' शब्द डिक्शनरीत असा दिसेल. असे करण्याचा नेमका फायदा काय होईल ते सांगणे कठीण आहे. ओपन सोर्स सॉफ्टवेअरमध्ये कम्युनिटीला काय वाटते याला महत्त्व असते. म्हणून या विषयात मी लोकांच्या मताचा अंदाज (मिळाल्यास!) घेणार आहे.

तसेच काही प्रत्यय विशेष वापरले जात नाहीत. आपण 'घोड्याई', 'घोड्याआ' असे म्हणत नाही. तेव्हा असे शब्द मिळाले की खालील प्रत्ययांसाठी नवीन रूल लिहीता येईल. तोवर सध्यातरी हे विभक्ती प्रत्यय बाद समजावेत.

द्वितीया ते
तृतीया ए , ही
पंचमी ऊन
सप्तमी ई, आ
_____

प्राथमिक पातळीवरील सफिक्स / प्रीफिक्स रूल्स असे दिसतील.

SFX P Y 5
SFX P 0 ण्या/QZac .
SFX P 0 ल्या/QZac .
SFX P 0 ल्यां/QZbc .
SFX P 0 लेल्या/QZac .
SFX P 0 लेल्यां/QZbc .

SFX Q Y 5
SFX Q 0 साठी/c .
SFX Q 0 नंतर/c .
SFX Q 0 वर/c .
SFX Q 0 मागे .
SFX Q 0 माग/c .

SFX Z Y 2
SFX Z 0 च .
SFX Z 0 ही .

SFX c Y 9
SFX c 0 स .
SFX c 0 ला .
SFX c 0 शी .
SFX c 0 हून .
SFX c 0 चा .
SFX c 0 ची .
SFX c 0 चे .
SFX c 0 च्या .
SFX c 0 त .

SFX a Y 1
SFX a 0 ने .

SFX b Y 3
SFX b 0 ना .
SFX b 0 नो .
SFX b 0 नी .

PFX m Y 4
PFX m 0 मुख्य .
PFX m 0 प्रधान .
PFX m 0 महा .
PFX m 0 उप .

PFX & Y 1
PFX & 0 अर्थ .

डिक्शनरीतील नोंदी अशा दिसतील.

मूल
मुला/QZac
मुलां/QZbc
बसणे
बस/P
मंत्री/&m
मंत्र्या/&QZacm
मंत्र्यां/&QZbcm

'करीत' असे टाईप केले की ऍटो करेक्ट ते उलटवून 'करित' असे करतो आहे. शुद्ध शब्द टाईप केल्यावर तो ऍटो करेक्टद्वारे अशुद्ध करण्याचा हा प्रकार हास्यास्पद आहे. हे फ्री आणि ओपन सोर्स सॉफ्टवेअर आहे हे समर्थन लंगडे आहे. 'करी' म्हणजे ताकाची आमटी या अर्थाने हा शब्द वापरला तर त्याचे रूप करित, करिचा असे होऊ शकेल. असा युक्तिवाद केस जिंकण्यासाठी कोर्टात केला जातो. इथे मात्र sed आणि grep कमांड वापरून डिक्शनरी आणि ऍटो करेक्ट सुधारणे हा मार्गच योग्य!

!sed -i 's/\bकरित\b/करीत/g' mr_IN.dic

! grep -v '\bकरित\b' DocumentList.xml > new.xml
! mv new.xml DocumentList.xml

युबंटू लाईव्ह सीडीची नवीन आवृत्ती आता उपलब्ध आहे. युबंटूच्या १८.०४ या व्हर्जनमध्ये मराठीसाठी अनुकूल बदल करून बनविलेल्या नवीन युबंटूला "रिमास्टर" असेही म्हणतात. यात लिबर ऑफिसचा स्पेल चेक व फायरफॉक्सचे मराठी स्पेल चेक ऍड ऑन अर्थात आहेच. Audacity आणि GIMP ही मूळ युबंटूत नसलेली सॉफ्टवेअर यात आधीच टाक़ून ठेवलेली आहेत.

त्याव्यतिरिक्त दोन मुख्य सुधारणा केल्या आहेत.
१) यशोमुद्रा, जैनी, लैला यासारखे अनेक युनिकोड फॉन्ट
२) मराठी / इंग्लिश दोन्ही भाषेत सहज टाईप करता यावे म्हणून F9 ही टॉगल की ऍड केली. "प्रमुख" सॉफ्टवेअरमध्ये F9 हीच की वापरली आहे. म्हणून युबंटूमध्ये देखील तीच ठेवली.

s3.ap-south-1.amazonaws.com/kagapa/ubuntu-18.04-v7-2-remaster.iso

वर दिलेली फाईल डाऊनलोड करून घ्या. याची साईज खूप मोठी आहे. (सुमारे दोन जी.बी. ) त्यानंतर "निरो" या सॉफ्टवेअरमध्ये "Burn Image to Disk” असा ऑप्शन वापरून युबंटूची सी.डी. तयार करा. ही सी.डी. कोणत्याही कॉम्प्युटरमध्ये टाकून तो सुरू केला की विंडोजच्या ऐवजी युबंटू सुरू होईल. सिडी काढून कॉम्प्युटर परत सुरू केला की पुन्हा विंडोज. याला लाईव्ह सिडी असे म्हणतात. याची चर्चा उपक्रमाच्या या पानावर वाचता येईल. कोणाला जर याचा सोर्स कोड पाहायचा असेल तर तो येथे उपलब्ध आहे.

s3.ap-south-1.amazonaws.com/kagapa/ubuntu-18.04-v7-2-remaster.iso

वर दिलेली फाईल डाऊनलोड करून घ्या. याची साईज खूप मोठी आहे. (सुमारे दोन जी.बी. ) त्यानंतर "निरो" या सॉफ्टवेअरमध्ये "Burn Image to Disk” असा ऑप्शन वापरून युबंटूची सी.डी. तयार करा. ही सी.डी. कोणत्याही कॉम्प्युटरमध्ये टाकून तो सुरू केला की विंडोजच्या ऐवजी युबंटू सुरू होईल. सिडी काढून कॉम्प्युटर परत सुरू केला की पुन्हा विंडोज. याला लाईव्ह सिडी असे म्हणतात. याची चर्चा उपक्रमाच्या या पानावर वाचता येईल. कोणाला जर याचा सोर्स कोड पाहायचा असेल तर तो येथे उपलब्ध आहे.>> हे भारी आहे.. करुन बघायला पाहिजे एकदा..

एका मैत्रिणीला ऑफलाईन मराठी टायपिंगसाठी मदत हवी होती. तिला हेडरमधली भाषाइंडियाची लिंक पाठवली. पण आता त्या लिंकवर एरर येते आहे.
भाषाइंडियाच्या होम-पेजवरून गेलं तरी तसंच होतं. Sad

प्रमुख-आयएमई तरी नीट चालतं का? असल्यास तिला त्याची लिंक पाठवेन.

भाषाइंडियाच्या होमपेजवरून मी मायक्रोसॉफ्टच्या भाषाइंडिया विभागात पोहोचू शकलो.

https://www.microsoft.com/en-in/bhashaindia/downloads.aspx

इथल्या व्यवस्थापकांना विनंती की त्यांनी भाषाइंडियाचा बदलेला पत्ता मूळ लेखात शक्य झाल्यास नमूद करावा.

ड्युप्लिकेट शब्द शोधण्यासाठी एक चांगले सॉफ्टवेअर येथे उपलब्ध आहे.

https://github.com/mtrevisan/Hunspeller

यात असे दिसते की "मुलांचा" हा शब्द अनेकवचनी रूल वापरून तयार होत आहेच पण तो आधीही जमा झालेला आहे. (ओळ क्रमांक १३७१८०) "हन्स्पेल नियमाला प्राधान्य" या नवीन धोरणाप्रमाणे रूल ठेवून आधीचा शब्द (ओळ क्रमांक १३७१८० वरील) काढून टाकावा.

अर्थात ड्युप्लिकेट शब्द डिक्शनरीत राहिले तरी काही फार फरक पडत नाही. पण आकार विनाकारण वाढतो. त्याला किती महत्त्व द्यायचे ते ज्याचे त्याने ठरवावे. वरील चित्रात "Extract wordlist" असा पर्याय आहे. तो वापरला की रूल वापरून बनलेले शब्द तसेच इतर शब्द यांची एकत्रित यादी आपोआप तयार होईल. ड्युप्लिकेट काढण्याकरता लिनक्स मधील सॉर्ट कमांडमध्येच "युनिक" पर्याय वापरता येतो तो असा...

sort -u t1.txt > x1.txt

प्रुफिंग टूल्स जीयुआय मध्ये ही सुविधा लवकरच उपलब्ध होईल. तोवर हे सॉफ्टवेअर वापरून पाहू शकता.

१५ व १६ फेब्रुवारी २०१९ या दोन दिवशी "ओपन सोर्स" विषयावर पुण्यात अधिवेशन असून मायबोलीवरील ज्यांना मराठी स्पेलचेक या विषयात रस असेल त्यांनी संपर्क केल्यास आपली तेथे भेट होऊ शकेल.

http://gnunify.sicsr.ac.in/

शक्य झाले तर मी "हन्स्पेल" या विषयावर छोटे व्याख्यानही देईन.

इथे वाचून मी प्रमुख-आयएमई वापरायला सुरूवात केली. दोन-एक महिने चांगलं चाललं. मात्र परवापासून ते अचानक काम करेनासं झालं आहे. मराठी टायपिंगचा पर्याय निवडला तरी रोमन अक्षरंच उठतात.
पीसी रिस्टार्ट करून पाहिला; प्रमुख-आयएमई अन-इन्स्टॉल करून परत इन्स्टॉल करून पाहिलं तरी काही उपयोग नाही.

मी त्यांच्या वेबसाईटवरच्या contact form मार्फत त्यांना ही समस्या कळवली. त्यांनाही त्याचं उत्तर माहिती नाही.

इथे कुणी काही सांगू शकेल का? कुणाला असा काही अनुभव आला आहे का?

मिसिंग बरहा… Sad बरहानं असा त्रास कधीही दिला नाही. Sad

माझ्या बाबतीत असेच थोडे आकृती या सॉफ्टवेअर मध्ये झाले. दोन वर्षे पूर्वी पर्यंत ते नीट वागत होते. पण पीसी मध्ये विंडोज 7install केल्या पासून आधीच्या फाइल्स आंडु गुंडु दिसत आहेत.. कंपनी ला संपर्क होऊ शकला नाही

नुकत्याच हाती आलेल्या वृत्तानुसार बरहाचं ताजं व्हर्जन (१०.१०) त्यांच्या वेबसाईटवरून फ्री डाऊनलोडसाठी उपलब्ध आहे. smiley-happy093.gif
मी डाऊनलोड करून वापरायला सुरूवात केली.

बरहाचं ताजं व्हर्जन (१०.१०) ची Link पण दिली असती तर अधिक बरे झाले असते माझ्यासारख्या आळशी पामरांना !

मी आत्ताच एका नवीन संगणकावरून प्रमुख आय. एम. ई. डाऊनलोड करून वापरून पाहिले. मला मराठी टाईप करण्यात काहीही समस्या आलेली नाही. स्पेल चेक देखील वापरून पाहिला. तो देखील नीट चालत आहे. “प्रमुख आयएमई" व "मराठी स्पेलचेक" या दोन गोष्टींची आडून आडून तसेच उघड उघड जाहीरात करण्यात मला संकोच (लाज म्हणा हवं तर) वाटत नाही. बराहप्रेमी समजून घेतील अशी आशा आहे.

बराहचे ३० दिवस मोफत चालणारे सॉफ्टवेअर येथे उपलब्ध आहे.
http://baraha.com/v10/baraha_setup.php

एक महिनाभर ते (फुकट) वापरता येईलही. पण त्यानंतर काय? बराहचा सेटअप प्रमुखपेक्षा खूपच जास्त आहे. त्याला बरीच मेमरी लागते. प्रमुख इतके हलके - फुलके (lightweight) सॉफ्टवेअर मी कधीच पाहिलेले नाही.

"आकृती" या सॉफ्टवेअरची चर्चा याआधी झालेली नाही कारण त्यात युनिकोड सपोर्ट नाही. माझ्या माहितीप्रमाणे ते मोफत नाही. ओपन सोर्स तर नाहीच नाही - म्हणजे त्यात काही बदल /सुधारणा करणे आपल्या आवाक्यात नाही.

बराह किंवा प्रमुख वापरून फक्त वर्डप्रेस नव्हे तर कुठेही मराठीत टाईप करता येते. पण माझ्यामते लिबर ऑफिसच्या रायटरमध्ये आधी टाईप करून मग ते हवे तिथे कॉपी - पेस्ट करणे जास्त सोयीचे ठरेल.

गुगल ट्रान्स्लेट

भाषांतरासाठी ही साईट वापरून पाहिली.
https://translate.google.com

काही निरीक्षणे नोंदवून ठेवत आहे.

१) हंस्पेल नियमांचा अभाव
हंस्पेल नियम तयार झाले की त्यांचा गुगलसारख्या मोठ्या कंपन्यांनादेखील फायदा होऊ शकेल. उदाहरण म्हणून गुगल ट्रांस्लेट या अवजाराचा उपयोग करून तयार होणारे मराठी शब्द पहा.

त्रिज्यामध्ये
व्यापारसाठी

त्रिज्या शब्दाचे सामान्यरूप "त्रिज्ये" असे असून शुद्ध शब्द "त्रिज्येमध्ये" असा आहे, "त्रिज्यामध्ये" नव्हे. व्यापार शब्दावरून "व्यापारसाठी" नव्हे तर "व्यापारासाठी" असा शब्द मिळतो.

२) इंग्रजी शब्दांचा सढळ वापर

फंडिंगच्या
कॅप्चर
इनपुटशी

असे भरपूर शब्द गुगलच्या भाषांतरात दिसतात. माझ्या स्पेलचेक डिक्शनरीत देखील असे बरेच शब्द आहेत हे मान्य. पण ते शब्द फक्त अशुद्ध शब्दांना पर्याय म्हणून राईट क्लिकवर दिसतात. म्हणजे "कैप्टन" शब्दावर उजवी टिचकी मारून त्याला "कॅप्टन" बनविणे - इतक्यापुरतेच माझी डिक्शनरी मर्यादित आहे. भाषांतरात असे इंग्रजी शब्द जसेच्या तसे वापरणे गुगलसारख्या मोठ्या कंपनीला शोभत नाही.

३) भन्नाट भाषांतर

अमर्तिकीकरण
अनुप्रयोग

अशा शब्दांचा अर्थ मराठी कोषातदेखील सापडणे कठीण आहे. भाषांतर म्हणजे शब्दाला शब्द जोडणे नव्हे. त्यातील भावदेखील पोहोचला पाहिजे.

४) अशुद्ध मराठी

शेतकर्यां कडून
करणार्या
दौर्यात

या व अशा इतर अशुद्ध शब्दांविषयी काय बोलणार?

एक महिनाभर ते (फुकट) वापरता येईलही. पण त्यानंतर काय? >>> नंतर, वापर सुरू ठेवू शकता, काही फीचर्स चालणार नाहीत, असा मला मेसेज आला होता. मला मुख्यत्वे आय.एम.ई.च लागतं. ते नीट चाललं तर तेवढं मला पुरेसं आहे. नाही चाललं तर मी तेवढं मॉड्युल सरळ विकत घेणार. (< २००० रु किंमत आहे.)

प्रमुख-आयएमईच्या निर्मात्याला मी संपर्क केला, माझा प्रॉब्लेम सांगितला, तर त्यालाही त्यावरचा उपाय माहिती नाहीये. थोडक्यात बरहाशिवाय माझ्याकडे सध्या तरी काही पर्याय नाही.

आपण बोलू तसे संगणकावर आपोआप टंकन होते, हा प्रकार मराठीत निर्दोष यायला अजून किती काळ लागेल ?
महितगारांनी सांगावे ही वि.

माझ्याकडे बरहा ९.३ आहे. ते Win7 वर व्यवस्थित चालतेय. Win८ किंवा Win १० वर test करून बघितले नाही.
९.३ चे मुक्तस्रोत लायसंस आहे असे दिसतेय.

'मायबोली' चे फोनेटिक टंकलेखन मला सर्वात जास्त आवडते पण त्याचा 'ऑफ-लाईन' पर्याय अद्याप उपलब्ध नाही. काय कारण असावे? का हा 'मायबोली'चा खडूसपणा म्हणायचा?
बापू करंदीकर

Pages