मराठीत ऑफलाईन टंकलेखन

Submitted by shantanuo on 11 September, 2018 - 09:51

गुगल इनपुट टूल्स वापरून ऑनलाईन टाइप करता येते.
https://www.google.com/inputtools/

पण मायक्रोसॉफ्ट वर्ड मध्ये टाईप करण्यासाठी त्याचा उपयोग नाही. भाषाइंडीया या साईटवरून डाऊनलोड केलेल्या इनपुट एडिटरचा अनुभव कसा आहे?
https://bhashaindia.com/downloads.aspx

यात स्पेल चेक / एटो करेक्ट नाही. तशी अपेक्षाही नाही कारण हे फक्त इनपुट टूल आहे. हा मजकूर मी याच टूलाचा वापरा करूंन वर्डमध्ये लिहिला आहे. मजकूर सेव्ह होण्यात काही अडचण (सध्या तरी) आलेली नाही. बरहाच्या आठवणीने अजूनही व्यथित होणार्या मंडळीनी वापरून बघायला हवे असे. ऑफलाईन टंकलेखन कारण्याकरता अजून काय मार्ग आहेत?

Group content visibility: 
Use group defaults

शिकागो युनिव्हर्सिटीने अ‍ॅन्ड्रॉइड अ‍ॅपच्या माध्यमातून काही डिक्शनरी मोबाईलवर उपलब्ध करून दिल्या आहेत. त्याविषयी लिहिताना मी याच धाग्यात १३ डिसेंबर २०२४ च्या पोस्टमध्ये दाते आणि वझे यांच्या डिक्शनरी शिकागो युनिव्हर्सिटीच्या अ‍ॅपमध्ये नाहीत या विषयी आश्चर्य व्यक्त केले होते. मराठीतील महत्त्वाच्या मानल्या जाणार्‍या सर्व पाच डिक्शनरी म्हणजे - दाते, तुळपुळे, वझे, मोल्सवर्थ आणि बर्नस्टोन आता एकाच अ‍ॅपमध्ये वापरता येतील.

https://play.google.com/store/apps/details?id=in.vipran.dadimi&hl=en_IN

त्यापैकी दाते डिक्शनरीत मराठी शब्दांचा अर्थ मराठीत तर मोल्सवर्थमध्ये मराठी शब्दांचा अर्थ इंग्रजीत दिलेला आहे. संस्कृतसाठी तर कित्येक डिक्शनरी उपलब्ध आहेत. त्या व्यतिरिक्त इतर भारतीय भाषा म्हणजे हिंदी, गुजराती, बंगाली वगैरे देखील डाऊनलोड साठी उपलब्ध आहेत.

सर्व भारतीय भाषांतील सर्व डिक्शनरी एका छत्राखाली आणि एकाच अ‍ॅपमध्ये आणण्याचे भगीरथ काम करणार्‍या प्रसन्न व्यंकटेश आणि त्यांच्या टीमचे हार्दिक अभिनंदन! हे अ‍ॅप सध्या तरी फक्त अ‍ॅन्ड्रॉइडसाठी उपलब्ध आहे. अ‍ॅपल आयफोनची आवृत्ती कदाचित नंतर येईल. आपण निदान प्ले स्टोअरवर ५ स्टार देऊन अशा ओपन सोर्स प्रयोगांना आपला पाठिंबा व्यक्त करू शकतो!

सर्व भारतीय भाषांतील सर्व डिक्शनरी एका छत्राखाली ?

👏 Great work ! 👏

अ‍ॅपल आयफोनची आवृत्ती कदाचित नंतर येईल.…

हे आले तर फार छान होईल.

<< हे अ‍ॅप सध्या तरी फक्त अ‍ॅन्ड्रॉइडसाठी उपलब्ध आहे. >>
Dadimi अ‍ॅप वापरण्याचा प्रयत्न केला, पण हे अ‍ॅप जुन्या अ‍ॅन्ड्रॉइडवर उपलब्ध आहे, version १६ वर उपलब्ध नाही.

<< प्ले स्टोअरवर ५ स्टार देऊन अशा ओपन सोर्स प्रयोगांना आपला पाठिंबा व्यक्त करू शकतो! >>
प्रयत्न कितीही स्तुत्य असला तरी हे अ‍ॅप F-Droid मध्ये उपलब्ध नाही आणि GPL/AGPL/LGPL सोर्स कोड उपलब्ध नाही, त्यामुळे मी तरी त्याला ओपन सोर्स म्हणणार नाही. कृपया प्रतिसाद दुरुस्त करावा, ही विनंती.

"स्टार-डिक्" हा हन्स्पेल सारखाच ओपन सोर्स प्रोजेक्ट आहे. वेगवेगळ्या भाषेतील डिक्शनरी त्या आकृतीबंधात उपलब्ध करून दिल्या आहेत आणि त्या सर्व ओपन सोर्स लायसन्स द्वारे उपलब्ध आहेत. उदाहरणार्थ मराठीतील डिक्शनरी सोर्स आपल्याला येथे पाहता येईल.

https://github.com/indic-dict/stardict-marathi

F-Droid मध्ये या अ‍ॅपचा सोर्स दिसत नाही हे आपले निरीक्षण बरोबर आहे पण त्यामुळे काही फरक पडत नाही कारण आत मधला सगळा माल ओपन सोर्स आहे! कोणीही अ‍ॅन्ड्रॉइड डेव्हलपर असे अ‍ॅप बनवू शकतो. उगाच नाही गूगल प्ले स्टोअरवर लाखोंनी अ‍ॅप उपलब्ध झाली आहेत. आता हे अ‍ॅप सोर्स-कोडसकट ओपन केले म्हणजे सगळाच कारभार ओपन सोर्स केला तर ढिगाने ड्युप्लिकेट अ‍ॅप बनतील आणि त्यामुळे फायदा होण्याऐवजी नुकसान होईल.

ओपन सोर्स सॉफ्टवेअर म्हणजे काही मोफत अन्नछत्र नाही. त्याला व्यावहारिक बाजू देखील आहे. अ‍ॅन्ड्रॉइड मध्ये बनविलेले अ‍ॅप आयफोन वर उपलब्ध करून देणे सोपे पण खर्चीक काम आहे. त्यासाठी लागणारे शंभर दोनशे डॉलर देखील आत्तापर्यंत प्रसन्न व्यंकटेश यांना कुणी दिलेले नाहीत. पैसे जाऊ द्या फक्त ५ स्टार द्या किंवा चार ओळींचा रिव्ह्यू लिहा अशी विनंती केली तरी कुणी लक्ष देत नाही.

इंग्रजीसह सर्व भारतीय भाषांतील स्पेल चेक टेलिग्राम बॉटच्या माध्यमातून उपलब्ध करून दिला आहे. त्यासाठी @dadimi_spell_bot या बॉटला तुम्हाला जो मजकूर तपासायचा असेल तो द्यायचा आहे. उदाहरणार्थ खाली दिलेल्या चित्रात मी इंग्रजी, हिंदी, गुजराती अशा वेगवेगळ्या भाषेतील मजकूर तपासून पाहिला. "बुन्देखण्ड" या शब्दाला "बुन्देलखण्ड" तर "प्राचन" या शब्दाला "प्राचीन" असा अचूक प्रतिसाद मिळत आहे.

प्रत्येक भाषेसाठी हन्स्पेल या आकृतीबंधात स्वयंसेवकांनी जमा केलेले शब्द वापरले आहेत. त्यामुळे स्पेलची चेकची क्वालिटी भाषेनुसार कमी - जास्त वाटू शकेल. त्यावर उपाय म्हणजे या ओपन सोर्स प्रकल्पाला आपले योगदान देऊन आपल्या ज्ञानाचा इतरांना उपयोग करून द्यावा. (सध्या उपलब्ध असलेल्या १२ भाषा : इंग्रजी, मराठी, हिंदी, गुजराती , बंगाली, तमीळ, तेलुगू, कन्नड, पंजाबी, आसामी, ओरिया, संस्कृत) मजकूर कोणत्या भाषेत लिहिलेला आहे हे ओळखण्यासाठी
फास्ट-टेक्स्ट
हे फेसबुकने बनविलेले मशिन लर्निंग मॉडेल वापरलेले आहे तर स्पेल चेकसाठी अर्थातच हन्स्पेल. दाडिमी स्पेल चेकचे अ‍ॅन्ड्रॉइड आणि आयफोन अ‍ॅप प्रसिद्धीच्या मार्गावर आहे. "अभि_नव" या सदस्याने २३ नोव्हेंबर २०२० च्या पोस्टमध्ये बांटु, सेनुटो यासारख्या आफ्रिकन भाषेतील स्पेल चेक उपलब्ध करून द्यावेत अशी सूचना केली होती. त्यावर सध्या काम चालू आहे पण माझ्या मते हन्स्पेल हा प्रकल्प फक्त इंडो-युरोपीयन भाषांसाठी योग्य ठरेल.

अनिंद्य यांनी आयफोनवरील डिक्शनरी अ‍ॅपची लिंक विचारली होती.

>>>> अ‍ॅपल आयफोनची आवृत्ती कदाचित नंतर येईल.…
>> हे आले तर फार छान होईल.

धवल पटेल यांनी असे अ‍ॅप नुकतेच बनविलेले दिसत आहे. hdict या नावाचे अ‍ॅप वापरून कृपया फीडबॅक द्या.
https://apps.apple.com/in/app/hdict/id6759493062
_____

उपाशी बोका यांना अपेक्षित असलेला AGPL सोर्स कोड येथे उपलब्ध आहे.
https://github.com/drdhaval2785/hdict
_____

संस्कृत भाषेचे जगभरात पसरलेले अभ्यासक ही साधने उपलब्ध करून देत आहेत असे दिसते. त्याचा फायदा संस्कृतसह मराठीसारख्या इतर सर्व भाषांना मिळत आहे, ही चांगली गोष्ट आहे. पण इतर भाषेचे अभ्यासक त्याबाबतीत विलक्षण उदासीन आहेत ही दुर्दैवाची गोष्ट आहे.

वर उल्लेख केलेला दाडिमी स्पेल बॉट @dadimi_spell_bot, मराठी स्पेल बॉट @MarathiSpellbot आणि युटिल हब बॉट @UtilHubBot तुमच्या टेलिग्राम ग्रुपमध्ये सामील करून घेतल्यावर कोणतीही गोष्ट शिकणे किती सोपे होऊन जाते ते खाली दिलेल्या स्क्रिनशॉटमध्ये दाखविले आहे.

सर्वप्रथम मी जेमिनी हे गूगलचे ए-आय मॉडेल वापरून हिंदू धर्माविषयी २ओळीत माहिती घेतली. त्यानंतर तो इंग्रजी मजकूर मराठीत भाषांतरित करून घेतला तसेच शुद्धलेखनाच्या चुका तपासल्या. हे सर्व मी फक्त ३-४ कमांड वापरून करू शकलो. (/gem /tr /dadimi /marathi)

१) गूगलचे जेमिनी हे मॉडेल तुम्ही ज्या सूचना (prompt) द्याल त्याप्रमाणे तंतोतंत काम करते. त्यासाठी /gem ही कमांड युटिल हब बॉटने उपलब्ध करून दिली आहे. त्या कमांडच्या पुढे तुम्हाला काय माहिती हवी आहे ते लिहायचे आहे.
/gem explain hindu dharma in 2 lines.

२) ट्रान्स्लेट या कमांडच्या पुढे mr हा मराठीचा दोन अक्षरी कोड द्यावा लागतो. वर दिलेल्या कमांडने जो मजकूर तयार झाला आहे त्या मजकुराला reply म्हणून ही कमांड वापरायची आहे. /tr ही कमांड देखील युटिल हब बॉटने उपलब्ध करून दिली आहे.
/tr mr

3) इंग्रजीसह इतर भारतीय भाषांतील मजकुराचे शुद्धलेखन मी बनविलेल्या दाडिमी या बॉटकडून तपासून घेऊ. त्यासाठी कोणत्याही इंग्रजी / मराठी मजकुराला reply म्हणून ही कमांड टाईप करायची आहे.
/dadimi

४) जर reply हा पर्याय वापरायचा नसेल तर inline पर्याय वापरता येतो. उदाहरणार्थ खाली दिलेली कमांड वापरल्यावर मी लिहिलेले तीनही शब्द चुकीचे आहेत हे लक्षात आले.
@MarathiSpellbot शुद्दलेखन निट लीहा

बॉटच्या नावापुढे जो मजकूर तपासायचा असेल तो टाईप केला किंवा कॉपी पेस्ट केला तरी चालेल. तुम्हाला खाली दाखविल्याप्रमाणे प्रतिसाद मिळेल.

[{"शुद्दलेखन": "शुद्धलेखन संवादलेखन"}, {"निट": "नीट नि नट निकट निघ"}, {"लीहा": "लिहा लाही"}] 3 words may be incorrect out of 3

कोणत्याही बॉटचा हा असा "इनलाईन" वापर करून आपण चालू संभाषणात व्यत्यय न आणता ए-आय आणि हन्स्पेलचा वापर करू शकतो. या सगळ्यासाठी टेलिग्राम या अ‍ॅपमध्ये फक्त एक ग्रुप बनवावा लागेल आणि त्यात वर दिलेले २-३ बॉट अ‍ॅड करावे लागतील.

टेलिग्राम या अ‍ॅपमध्ये मराठी स्पेल बॉट (@MarathiSpellbot) कसा वापरता येतो ते खाली दिलेल्या तीन स्क्रिनशॉटमधून स्पष्ट होईल. १) पहिल्या स्क्रीनमध्ये मी काही मजकूर टाईप किंवा कॉपी पेस्ट केला आहे. त्यातील चुका मला दाखवून दिल्या गेल्या आहेत. २) दुसर्‍या स्क्रीनशॉट मध्ये आपण हे पाहू शकता की कोणत्याही टेलिग्राम ग्रुपमध्ये हाच बॉट "इनलाइन" वापरता येतो. म्हणजे @MarathiSpellbot असे टाईप करून मग काही मराठी मजकूर टाईप केला की त्या वाक्यातील चुका तिथल्या तिथे दिसून येतात. "परयतन" असे टाईप केले तर "प्रयत्न" असे सुचविले गेले आहे. ३) एखाद्याने चुकीचे वाक्य टाईप केले असेल तर त्यात काय चूक आहे हे त्याला समजावत न बसता फक्त त्या मेसेजलाच रिप्लाय देऊन /marathi अशी कमांड द्यायची आहे. त्यामुळे त्या वाक्यातील चुका ग्रुपमधील सर्वांना आपोआप समजतील. "करने" ला "करणे" तर "कठिण" ला "कठीण" असे शब्द सुचविलेले तिसर्‍या स्क्रीनमध्ये दिसत आहेत.

टेलिग्राम हे अ‍ॅप वापरणार्‍यांनी या बॉटचा अवश्य वापर करावा. व्हॉट्सअ‍ॅप मध्ये अशी काही सोय करता येणे शक्य आहे की नाही याची मला माहिती नाही. जे आयफोन वापरतात किंवा ज्यांना काही कारणाने मराठी स्पेल चेक हे अ‍ॅन्ड्रॉइड अ‍ॅप डाउनलोड करायचे नसेल त्यांनी या पर्यायाचा अवश्य विचार करावा. स्पर्धा परीक्षेची तयारी करणार्‍या विद्यार्थांना देखील याचा उपयोग होऊ शकतो.

धवल पटेल यांनी आता त्यांच्या hdict या अ‍ॅपची अ‍ॅन्ड्रॉइड आवृत्ती उपलब्ध करून दिलेली आहे.

https://play.google.com/store/apps/details?id=in.sanskritworld.hdict

दाडिमी या अ‍ॅप सारखाच एच. डिक् अ‍ॅपमध्ये देखील मराठीच्या पाच डिक्शनरीत एकत्रित शोध घेता येतो. त्यासाठी हे अ‍ॅप इन्स्टॉल केल्यावर मराठी भाषा निवडा. त्यानंतर तुम्हाला हव्या त्या निवडक डिक्शनरी डाऊनलोड करता येतात. काही लोकांना हे सर्व जमविणे कठीण वाटू शकते तर काहींना इतका वेळ घालविणे शक्य नसते. त्यांच्यासाठी मी @Starmarathibot या नावाचा टेलिग्राम बॉट बनविला आहे. तुम्ही कोणताही शब्द दिलात की तो या पाच डिक्शनरीमधील सर्व नोंदी तुमच्या पुढे हजर करेल खाली दाखविल्याप्रमाणे:

काही लोकांना मुळात टेलिग्राम या अ‍ॅपविषयीच काही आक्षेप असू शकतात. पण माझ्यामते टेलिग्राम मधील बॉट आणि चॅनेल अत्यंत उपयोगी आहेत. टेलिग्रामचा कदाचित कोणाकडून गैरवापर होत असेलही. पण म्हणून त्यावर बंदी घालणे म्हणजे चाकूने खून होतात म्हणून स्वैपाकघरातील चाकूवर बंदी घालण्यासारखे होईल.

१३ नोव्हेंबर २३ च्या पोस्टमध्ये मी विकीसोर्स वरील एक पूर्ण पुस्तक तासाभरात स्पेल चेक केल्याचा उल्लेख केला होता. आज खाली दिलेली कमांड वापरून तेच पुस्तक एका मिनिटात स्पेल चेक केले.

curl -X POST -F "file=@chandvad.txt" "https://3xkzrpepivcfloqhwrs6mhyuia0kXXXX.lambda-url.us-east-1.on.aws/" > out.txt

चाळीस हजार शब्दांपैकी दीड हजार शब्द चुकीचे म्हणून दाखविले जात आहेत कारण या पुस्तकात ग्रामीण शब्द भरपूर प्रमाणात वापरले गेले आहेत. (उदा. तेवडं, माज्या, अहेवपणी, लई, जल्मा, शिरीहारी, परायाची, धडुतं, कोरभर) त्याचबरोबर आंबेठाण, चांदवड अशी गावांची नावे चुकीची म्हणून समजली गेली आहेत. ते सर्व शब्द वगळले तरी शे - दोनशे चुका सहज सापडल्या. लेखकांनी (किंवा विशेषतः प्रकाशकांनी) प्रुफ - रीडरवर अवलंबून न राहता या कमांडचा वापर करून स्वतःच चुका शोधाव्यात. या कमांडमध्ये चार X (XXXX) आहेत ती काय अक्षरे आहेत ते विचारले तर मी इ-मेल द्वारे सांगेन. हॅकर / बॉटना दूर ठेवण्यासाठी असे करावे लागत आहे एरवी ही सुविधा अर्थातच मोफत आहे.

Pages