Submitted by shantanuo on 11 September, 2018 - 09:51
गुगल इनपुट टूल्स वापरून ऑनलाईन टाइप करता येते.
https://www.google.com/inputtools/
पण मायक्रोसॉफ्ट वर्ड मध्ये टाईप करण्यासाठी त्याचा उपयोग नाही. भाषाइंडीया या साईटवरून डाऊनलोड केलेल्या इनपुट एडिटरचा अनुभव कसा आहे?
https://bhashaindia.com/downloads.aspx
यात स्पेल चेक / एटो करेक्ट नाही. तशी अपेक्षाही नाही कारण हे फक्त इनपुट टूल आहे. हा मजकूर मी याच टूलाचा वापरा करूंन वर्डमध्ये लिहिला आहे. मजकूर सेव्ह होण्यात काही अडचण (सध्या तरी) आलेली नाही. बरहाच्या आठवणीने अजूनही व्यथित होणार्या मंडळीनी वापरून बघायला हवे असे. ऑफलाईन टंकलेखन कारण्याकरता अजून काय मार्ग आहेत?
Groups audience:
Group content visibility:
Use group defaults
शेअर करा
शंतनु, इतर बरेच सॉफ्टवेअर
शंतनु, इतर बरेच सॉफ्टवेअर इन्स्टॉल्ड आहे.
तुम्ही तयार केलेली OS इन्स्टॉल करायची तर आधी सगळ्यांची यादी करून मग ते परत रिइंस्टॉल करावे लागले असते. नविन संगणक सेट अप करायचा तर तुमची OS खूप सोयीस्कर पडेल.
आपल्या मार्गदर्शनाबद्दल धन्यवाद!
सफिक्स रूल वापरून डिक्शनरीतील
सफिक्स रूल वापरून डिक्शनरीतील शब्द वाढविण्याचा माझा नवीन प्रयत्न चालू आहे. उदाहरण म्हणून "मूल" हा शब्द पाहू. सध्या मूल या शब्दापासून होणारे पुष्कळसे शब्द एकेक करून या यादीत जमा केले आहेत. म्हणजे मुलाचा, मुलांची, मुलापासून वगैरे. आता अशा शब्दांची संख्या खूप असल्यामुळे सर्व शब्द नाही - पण वापरात असणारे शब्द आम्ही जमा केले.
जमेल तसे, जमेल तितके , मिळतील तिथून शब्द साठवण्याची ही पद्धत सदोष आहे. छंद म्हणून ठीक पण सायंटिफिक पद्धत वापरायची झाली तर सफिक्स रूल वापरावे लागतील. म्हणजे डिक्शनरीत फक्त ३ शब्द असतील.
मूल
मुला
मुलां
यात सर्वप्रथम मूळ शब्द, त्यानंतर एकवचनी व अनेकवचनी सामान्यरूपे. यापासून सफिक्स नियमाद्वारे ह्न्स्पेल इंजीन सर्व शब्द बनवेल. उदा....
मुलास, मुलाला, मुलाने, मुलाशी, मुलाहून, मुलाचा, मुलाची, मुलाचे, मुलात,
मुलांस, मुलांला, मुलांना, मुलांनी, मुलांशी, मुलांही, मुलांहून, मुलांचा, मुलांची, मुलांचे, मुलांत, मुलांनो
सफिक्स रूल हा असा लिहितात.
SFX ek Y 9
SFX ek 0 स .
SFX ek 0 ला .
SFX ek 0 ने .
SFX ek 0 शी .
SFX ek 0 हून .
SFX ek 0 चा .
SFX ek 0 ची .
SFX ek 0 चे .
SFX ek 0 त .
पहिल्या ओळीत आपण या एकवचनी सफिक्स रूलचे नामकरण करून त्याला 'ek’ असे म्हणू. हा लागू असल्याने 'Y’ आणि खाली दिलेल्या ९ ओळींपुरता मर्यादित. अशाच पद्धतीने १२ ओळींचा अनेकवचनी रूल लिहिला. त्यालाही काही नाव द्यावे लागेल. ते दिले 'an’
SFX an Y 12
SFX an 0 स .
SFX an 0 ला .
SFX an 0 ना .
SFX an 0 नी .
SFX an 0 शी .
SFX an 0 ही .
SFX an 0 हून .
SFX an 0 चा .
SFX an 0 ची .
SFX an 0 चे .
SFX an 0 त .
SFX an 0 नो .
आता हे दोन नियम कोणत्या शब्दांना लावायचे ते कसे कळावे? म्हणून...
मूल
मुला/ek
मुलां/an
प्रुफिंग टूल्स जी.यु. आय. या सॉफ्टवेसमध्ये हे शब्द कसे तयार होतील ते पाहता येते.
आता हे इतके सोपे असेल तर सर्व शब्द नियमात बसवायला काय अडचण आहे? मला मूळ शब्द व त्यांच्या सामान्यरुपांची यादी नेटवर कुठेही मिळाली नाही. म्हणजे ती यादी अशी दिसायला हवी...
मूल
मुला/ek
मुलां/an
घोडा
घोड्य़ा/ek
घोड्य़ां/an
ही पोस्ट वाचणाऱ्यांपैकी ज्यांना आस्था असेल त्यांनी शक्य होतील तितके शब्द टाईप करून माझ्याकडे पाठवले तर सर्वांनाच याचा फायदा होईल. ही यादी मुक्त स्त्रोत असेल, कोणालाही वापरता येईल आणि त्याचा काहीही मोबदला मिळणार नाही.
म्हणजे अशी यादी हवी आहे का?
म्हणजे अशी यादी हवी आहे का?
चुल
चुला/ek
चुलीं/an
सफरचंद
सफरचंदा/ek
सफरचंदां/an
(सफरचंदात काय अपेक्षित आहे ते कळले नाही.)
तसेच नावे असल्यास कसे सफिक्स अपेक्षित आहे? म्हणजे उदा. अथेन्स हे नाव कसे केले पाहिजे?
अथेन्स
अथेन्सा/ek
अथेन्स/an
मुद्दाम हे घेतले कारण भारतीय किंवा महाराष्ट्रातील शहरांची नावे संभाषणानुसार बदलतात. म्हणजे 'नाशिक येथे द्राक्षे पिकतात' हेच 'नाशकात द्राक्षे खुप होतात'. असे ही बोलले आणि लिहिले जाते.
पण इतर बाह्य देशातील नावे मात्र सहसा वेगळी येतात. म्हणजे 'तो सध्या अथेन्सात रहायला गेला' असे 'सहसा' म्हणत नाही. मग ek आणि an दोन्ही अथेन्स राहतील का?
मग हे शब्द नियमात कसे बसवणे आवश्यक आहे?
बाकी अशी यादी बनवायला मी थोडीफार खारीची मदत करू शकेन.
तुम्ही शब्द दिले तर मी एक्सेलात काहातरी मॅक्रो जुगाड करून असे शब्द बनवता येतात का ते पाहतो.
(अन्यथा शब्द शोधायचीही तयारी आहे.)
हे कार्य करताना जर अनेकजण मदत
हे कार्य करताना जर अनेकजण मदत करत असतील तर अक्षरे वाटून घ्यावीत किंवा दिली जावीत.
>> हे कार्य करताना जर अनेकजण
>> हे कार्य करताना जर अनेकजण मदत करत असतील तर ...
अनेकजण मदत करतील अशी शक्यता फार कमी आहे. उदाहरणार्थ "किल्ली" या व्यक्तीने मदत करायची तयारी जाहीरपणे याच धाग्यात दाखविली. मी ई-मेल केला. पण त्यानंतर त्यांना वेळ मिळालेला दिसत नाही. फ्री आणि ओपन सोर्स सॉफ्टवेअरचे हेच दुखणे आहे आणि हेच बलस्थान देखील.
>> अक्षरे वाटून घ्यावीत किंवा दिली जावीत.
त्याची गरज नाही. प्रुफींग टूल्स जी.यू.आय. या सॉफ्टवेअरमध्ये इंपोर्ट, मर्ज, सॉर्ट, डि-ड्युप्लिकेशन या सर्व सोयी आहेत. ते कमी पडले तर पायथॉन स्क्रिप्ट लिहून सर्व शब्द एकत्र करायला कितीसा वेळ लागणार आहे? अक्षरे वाटली तर मर्यादा पडतील. तेच ते शब्द दोघा-तिघांनी पाठविले तरी चालेल.
>> तुम्ही शब्द दिले तर मी एक्सेलात काहातरी मॅक्रो जुगाड करून असे शब्द बनवता येतात का ते पाहतो.
पायथॉनमध्ये असे बरेच जुगाड करून थकल्यावर शेवटी मायबोलीवर मदतीसाठी आवाहन केले आहे. एक्सेल मॅक्रोचा काहीही फायदा होणार नाही.
>> मग ek आणि an दोन्ही अथेन्स राहतील का?
अथेंस हे शहराचे नाव असल्यामुळे त्याचे अनेकवचन होणार नाही आणि सामान्यरूपही तेच राहील. म्हणून माझ्यामते हे दोन शब्द डिक्शनरीत घेता येतील.
अथेंस
अथेंस/ek
पण "पुणे" शब्दाचे सामान्यरूप "पुण्या" (पुण्यात, पुण्याचे, पुण्याची) असे होईल.
पुणे
पुण्या/ek
या दोन शहरात एक मुलभूत फरक हा आहे की सामान्य मराठी माणसाच्या लिहिण्यात "अथेंस" विशेष येत नाही. बरोबर? मग तो शब्द डिक्शनरीत घेऊन उगाच साईज का वाढवा? कोणता शब्द घ्यायचा व कोणता नाही याचा निर्णय मी (आम्ही - स्वयंसेवक मिळून) तारतम्याने घेत आलो आहोत. इंग्रजीत ज्याप्रमाणे en-uk आणि en-us अशा दोन डिक्शनरी आहेत त्याप्रमाणे मराठीत अधिक सर्वसमावेशक स्पेल चेक कुणी बनविला तर स्वागत आहे.
>> म्हणजे 'नाशिक येथे द्राक्षे पिकतात' हेच'नाशकात द्राक्षे खुप होतात'. असे ही बोलले आणि लिहिले जाते.
बोलले जाते हे माहीत होते. लिहीले जाते या विषयी शंका होती. गूगलमध्ये पाहिले तर सकाळ, लोकमत यासारख्या वृत्तपत्रांत "नाशकात" शब्द दिसत आहे तेव्हा तो डिक्शनरीत घेता येईल.
नाशिक
नाशिक/ek
नाशका/ek
पण यात रिस्क अशी आहे की यामुळे "नासलेला" या शब्दाला "नाशकाला" असा पर्यायी शब्द दिसू शकतो. म्हणून बोली भाषेतील सामान्यरूपे घेऊ नयेत. (माझ्या मते)
नाशिक
नाशिक/ek
तांत्रिक मुद्द्यावर नाशका/ek ही नोंद खारीज होत असली तरी ही काही दगडावरची रेघ नाही. चूल, सफरचंद या शब्दांत काय अपेक्षित आहे हे मला देखील खात्रीने सांगता येणार नाही. अनुभवी व्यक्तींचे मार्गदर्शन अपेक्षित. ज्यांना संगणक हाताळता येत नाही त्यांनी वरील नियमात बसणारे शब्द कागदावर लिहून पोस्टाने माझ्याकडे पाठविले तरी चालेल.
"नासलेला" या शब्दाला "नाशकाला
"नासलेला" या शब्दाला "नाशकाला" असा पर्यायी शब्द दिसू शकतो.
हे तर व्हायला नको!
तसेच डेटाबेस ची साईज वाढल्याने काय तोटा आहे? उलट येतील तेव्हढे सर्व शब्द सामाविष्ट करावेत अशा मताचा मी आहे.
असो.
शब्दांचा एक नमुना आज उद्याकडे चिकटवण्याचा प्रयत्न करेन.
वर लिहिल्या प्रमाणे अ
वर लिहिल्या प्रमाणे अ अक्षराचे काही शब्द देत आहे.
--
अक्षरा
अक्षरा /ek
अक्षरां /an
अनाथ
अनाथा /ek
अनाथां /an
अनर्थ
अनर्था /ek
अनर्थां /an
अपघात
अपघाता /ek
अपघातां /an
अपेक्षा
अपेक्षां /an
अतृप्त
अतृप्ता /ek
अतृप्तां /an
अपेक्षाभंग
अपेक्षाभंगा /ek
अपेक्षाभंगां /an
अभिवादन
अभिवादना /ek
अभिवादनां /an
अभिवचन
अभिवचना /ek
अभिवचनां /an
अभिनंदन
अभिनंदना /ek
अभिनंदनां /an
अभिनेता
अभिनेत्या /ek
अभिनेत्यां /an
अरण्य
अरण्या /ek
अरण्यां /an
अवर्षण
अवर्षणा /ek
अवर्षणां /an
अडचण
अडचणी /ek
अडचणीं /an
अभ्यास
अभ्यासा /ek
अभ्यासां /an
अन्न
अन्ना /ek
अन्नां /an
अण्णा
अण्णां /an
अग्नी
अग्नीं /an
अचल
अचला /ek
अचलां /an
अचंबा
अचंब्या /ek
अचंब्यां /an
अतिथी
अतिथ्या /ek
अतिथीं /an
अत्याचार
अत्याचारा /ek
अत्याचारां /an
अपराध
अपराधा /ek
अपराधां /an
अपमान
अपमाना /ek
अपमानां /an
अपाय
अपाया /ek
अपायां /an
अश्रू
अश्रूं /an
अंबर
अंबरा /ek
अंबरां /an
अमृत
अमृता /ek
अमृतां /an
अंक
अंकां /ek
अंकां /an
अद्ययावत
अद्ययावता /ek
अद्ययावतां /an
अद्यतन
अद्यतना /ek
अद्यतनां /an
अध्यासन
अध्यासना /ek
अध्यासनां /an
अघोर
अघोरा /ek
अघोरां /an
अट
अटी /ek
अटीं /an
अटतटी
अटतटीं /an
अगणित
अगणिता /ek
अगणितां /an
असंख्य
असंख्या /ek
असंख्यां /an
अजय
अजया /ek
अजेय
अजेया /ek
अजेयां /an
अभाव
अभावा /ek
अभावां /an
अदृश्य
अदृश्या /ek
अदृश्यां /an
अद्वितीय
अद्वितीया /ek
अद्वितीयां /an
अचपल
अचपला /ek
अचपलां /an
अपंग
अपंगा /ek
अपंगां /an
अहवाल
अहवाला /ek
अहवालां /an
अंगठा
अंगठ्या /ek
अंगठ्यां /an
अंग
अंगा /ek
अंगां /an
अडाणी
अडाण्या /ek
अडाण्यां /an
अकर्म
अकर्मा /ek
अकर्मां /an
अखंड
अखंडा /ek
अखंडां /an
अगोचर
अगोचरा /ek
अगोचरां /an
अचूक
अचूका /ek
अचूकां /an
अचेतन
अचेतना /ek
अचेतनां /an
अचैतन्य
अचैतन्या /ek
अचैतन्यां /an
अच्युत
अच्युता /ek
अच्युतां /an
अज
अजा /ek
अजां /an
अजर
अजरा /ek
अजरां /an
अजरामर
अजरामरा /ek
अजरामरां /an
अजाण
अजाणा /ek
अजाणां /an
अजाणता
अजाणत्या /ek
अजाणत्यां /an
अजात
अजाता /ek
अजातां /an
अजिंक्य
अजिंक्यां /ek
अजिंक्यां /an
अजीर्ण
अजीर्णा /ek
अजीर्णां /an
अटळ
अटळा /ek
अटळां /an
अढळ
अढळा /ek
अढळां /an
अतर्क्य
अतर्क्या /ek
अतर्क्यां /an
अतुलनीय
अतुलनीया /ek
अतुलनीयां /an
अतुष्ट
अतुष्टा /ek
अतुष्टां /an
अतुल्य
अतुल्या /ek
अतुल्यां /an
अतूट
अतूटा /ek
अतूटां /an
अतृप्त
अतृप्ता /ek
अतृप्तां /an
अद्वितीय
अद्वितीया /ek
अद्वितीयां /an
अद्वैत
अद्वैता /ek
अद्वैतां /an
अद्वैतभाव
अद्वैतभावा /ek
अद्वैतभावां /an
अद्वैतवाद
अद्वैतवादा /ek
अद्वैतवादां /an
अधम
अधमा /ek
अधमां /an
अधर्म
अधर्मा /ek
अधर्मां /an
अधार्मिक
अधार्मिका /ek
अधार्मिकां /an
अधीर
अधीरा /ek
अधीरां /an
अनित्य
अनित्या /ek
अनित्यां /an
अनियंत्रित
अनियंत्रिता /ek
अनियंत्रितां /an
अनिश्चित
अनिश्चिता /ek
अनिश्चितां /an
अनिष्ट
अनिष्टा /ek
अनिष्टां /an
अपरिचित
अपरिचिता /ek
अपरिचितां /an
अपरिणीत
अपरिणीता /ek
अपरिणीतां /an
नियमात SFX an 0 ला . हे काही
नियमात SFX an 0 ला . हे काही शब्दांना व्यवस्थित बसतेय असे वाटत नाही...
१) सर्वप्रथम आपल्या
१) सर्वप्रथम आपल्या सहकार्याबद्दल धन्यवाद.
२) यापुढे मात्र इ-मेलने संपर्क करावा. सर्वच वाचकांना यापुढील चर्चेत रस असेल असे नाही. विषय निघाला आहे म्हणून माझ्या प्रतिक्रिया खाली देत आहे.
अ) काही शब्द शब्दकोशांपुरतेच मर्यादित असतात. त्यांचा प्रत्यक्षात वापर फार कमी होतो. असे शब्द घेऊ नयेत. कारणे दोन. १) डेटाबेसचा आकार मर्यादित ठेवला नाही तर स्पेल चेकर स्लो होईल. २) हे शब्द सुचवणीत अस्थानी दिसतील. उदा. अजांना हा शब्द टेक्निकली बरोबर असला तरी वापरला जात नाही. आणि तो इतर शब्दांना सुचविला गेला तर त्याला अर्थ नाही. खालील शब्दांचा फेरविचार व्हावा ही विनंती.
अटतटी
अटतटीं /an
अज
अजा /ek
अजां /an
ब) खाली दिलेले शब्द आपण त्यांच्या अनेकवचनी रूपांसह घेतले आहेत. "अद्वितीयांस" असा शब्द असलेली किती वाक्ये बनतील? गुगल हे काही प्रमाण नव्हे पण त्यात जर त्या शब्दाचे एकही पान दिसत नसेल तर तो शब्द आपण कोणीच वापरत नाही असे म्हणायला जागा आहे.
अजीर्ण
अटळ
अढळ
अतुलनीय
अद्वितीय
अमृत
अभ्यासक / विद्वान यांच्या प्रबंधात असे काही अनेकवचनी शब्द असू शकतात. पण हा प्रोजेक्ट "कॉमन मॅन" साठी आहे. माझ्यामते हे शब्द एकवचनी वापरले जातात. काही शब्दांना तर विभक्ती प्रत्ययही लागत नाहीत.
क) काही शब्दांचे अनेकवचनी रूप बनते पण ते फक्त 'ना’, 'नो' अशा ठरावीक प्रत्ययांपुरते मर्यादित असते. अशा केसेस करता नवीन रूल बनवावा लागेल.
SFX an2 Y 1
SFX an2 0 ना .
शब्दांची जी रूपे आपण हे रूल वापरून बनवीत आहात त्यांचा प्रत्यक्षात वापर होत आहे का हा महत्त्वाचा मुद्दा आपण विचारात घेतलेला दिसत नाही.
>> नियमात SFX an 0 ला . हे काही शब्दांना व्यवस्थित बसतेय असे वाटत नाही...
तसे असेल तर नवीन सफिक्स रूल (तुम्हीच) लिहायचा आहे. इंग्रजीतील अनेकवचनी शब्द कसे बनविले जातात ते येथे वाचता येईल.
उदाहरण म्हणून आपण हा रूल पाहू…
SFX ek1 Y 4
SFX ek1 डा ड्याचा डा
SFX ek1 डा ड्याची डा
SFX ek1 डा ड्याचे डा
SFX ek1 डा ड्याच्या डा
या सफिक्स रूलमध्ये ५ कॉलम आहेत. पहिले दोन कॉलम आपल्या परिचयाचे आहेत. पाचवा कॉलम म्हणतो,
शब्दाच्या शेवटी “डा” असलेल्या शब्दांना हा नियम लागू आहे. तिसरा कॉलम म्हणतो की शेवटचा "डा" काढून टाका आणि त्याला (चौथ्या कॉलममध्ये दाखविलेला) "ड्याचा" असा जोड द्या.
थोडक्यात तिसऱ्या स्तंभात असलेले "डा" हे अक्षर काढून त्याच्या जागी चौथ्या स्तंभात असलेले अक्षर जोडायचे आहे.
घोडा - "डा" = घो
घो + "ड्याचा" = घोड्याचा
अशा पद्धतीने चार शब्द बनतील घोड्याचा, घोड्याची, घोड्याचे, घोड्याच्या आणि डिक्शनरीत नोंद होईल ती अशीः
घोडा
घोडा/ek1
सध्या तरी आपण फक्त मी १४ ऑक्टोबर या दिवशी पोस्ट केलेले २ सफिक्स रूल वापरू. कारण वर दिलेल्या पद्धतीने बनविलेले रूल्स इतके क्लिष्ट बनतील की ते वापरणे / बदलणे कठीण होईल. स्वतंत्रपणे सफिक्स रूल लिहिण्याइतके तज्ञ मिळाले की हा स्पेल चेक अधिक उपयोगी होईल हे नक्कीच.
नवीन सफिक्स रूल (तुम्हीच)
नवीन सफिक्स रूल (तुम्हीच) लिहायचा आहे.
काय शंतनुराव तुम्ही हे सांगायचे ना!
ठिकाय. आता तसे करू.
ते साधन उतरवले आहे. पण कसे वापरायचे ते पाहायला वेळ झाला नाही.
शब्द हवे तर विपत्रातून पाठवू पण चर्चा इथेच झाली तर बरे.
कुणाला तरी यात रस असेलच...
आत्ता नसेल तर नंतर कधीतरी असेल.
हा विषय गुगल वर सर्च करताना सापडेल.
कदाचित मायबोली वर स्पेलचेल उपलब्ध करून देता येईल वगैरे वगैरे.
तेव्हा इतरांना रस आहे की नाही याची काळजी नको.
ज्यांना रस नाही ते आपल्याकडे दुर्लक्ष्य करतील.
-सध्या तरी आपण फक्त मी १४ ऑक्टोबर या दिवशी पोस्ट केलेले २ सफिक्स रूल वापरू. -
चालेल.
कुणाला तरी यात रस असेलच...
कुणाला तरी यात रस असेलच...
आत्ता नसेल तर नंतर कधीतरी असेल.>>>
+१ चर्चा इथेच करावी आणि जे कोणी शब्द विपत्राने पाठवतील, त्यांनी ते पाठवल्याचे इथे आवर्जून लिहावे. इतरांना प्रोत्साहन मिळेल.
आ अक्षरपासून होणारे शब्द देत
आ अक्षरपासून होणारे शब्द देत आहे.
क्षमस्व विपत्र करता आले नाही.
बरोबर आहेत का ते कळवावे.
आंध्र
आंध्रा/ek
आइसलँड
आइसलँड/ek
आई
आई/ek
आईं/an
आकर्षण
आकर्षणा/ek
आकर्षणां/en
आकार
आकारा/ek
आकारां/en
आकाश
आकाशा/ek
आग
आगी/ek
आगीं/en
आग्रा
आग्र्या/ek
आठ
आठा/ek
आठां/en
आदिवासी
आदिवासी/ek
आदिवासी/en
आनंद
आनंदा/ek
आभार
आभारा/ek
आभारां/en
आम्ल
आम्ला/ek
आम्लां/en
आम्लपित्त
आम्लपित्ता/ek
आयर्लंड
आयर्लंडा/ek
आयर्लंडां/en
आयुर्वेद
आयुर्वेदा/ek
आयुर्वेदां/en
आराध्यदैवत
आराध्यदैवता/ek
आराध्यतातां/en
आरोग्य
आरोग्या/ek
आर्जेन्टिना
आर्जेन्टिना/ek
आर्मेनिया
आर्मेनिया/ek
आले
आल्या/ek
आल्या/en
आल्बेनिया
आल्बेनिया/ek
आवाज
आवाजा/ek
आवाजां/en
आवार
आवारा/ek
आवारां/en
आशा
आशा/ek
आशां/en
आशिया
आशिया/ek
आश्चर्य
आश्चर्या/ek
आश्चर्यां/en
आसन
आसना/ek
आसनां/en
आसाम
आसामा/ek
आहार
आहारा/ek
आहारा/en
आहारशास्त्र
आहारशास्त्रा/ek
आहारशास्त्रा/en
वर शंतनुने दिलेया सफिक्स
वर शंतनुने दिलेया सफिक्स नियमात यादीतील शब्द व्यवस्थित बसतात का हे कुणी तरी कृपया पाहील का?
काम करताना चुका होऊ शकतात.
आसाम
आसाम
आसाम/ek असे हवे.
तसेच आश्चर्य / अचंबा / आशा यांच्या अनेकवाचनाची गरज नाही, वापरल्याजाण्याची शक्यता जवळजवळ शून्य.
आशा
आशे/ek असे हवे.
आले, आयुर्वेद, आयर्लंड यांचे अनेकवचन होणार नाही त्यांचा /en नियम काढून टाकायला हवा.
आहार
आहार
आहारा/ek
आहारांं/en
आहारशास्त्र
आहारशास्त्रा/ek
आहारशास्त्रां/en
वा मानवाने छान काम केले.
वा मानवाने छान काम केले. आशा आहे शंतनु सुधारणा घेतील.
इ आणि इं ने सुरू होणारे शब्द
इ आणि इं ने सुरू होणारे शब्द
इंग्रजी
इंग्रजी/ek
इंग्रजी/en
इंग्रज
इंग्रजा/ek
इंग्रजां/en
इंच
इंचा/ek
इंचां/en
इंजिन
इंजिना/ek
इंजिनां/en
इंडोनेशिया
इंद्र
इंद्रा/ek
इंद्रां/en
इंद्राणी
इंद्राणी/ek
इक्वेडोर
इक्वेडोर/ek
इच्छा
इच्छा/ek
इच्छां/en
इच्छित
इच्छिता/ek
इच्छितां/en
इजिप्त
इजिप्त/ek
इटली
इटली/ek
इटानगर
इटानगरा/ek
इतर
इतरा/ek
इतरां/en
इतिहास
इतिहासा/ek
इतिहासां/en
इथियोपिया
इथियोपिया/ek
इन्स्ट्रुमेंट
इन्स्ट्रुमेंटा/ek
इन्स्ट्रुमेंटां/en
इराक
इराक/ek
इराण
इराण/ek
इरिट्रिया
इरिट्रिया/ek
इष्ट
इष्टा/ek
इष्टां/en
इस्रायल
इस्रायल/ek
अरे सफिक्स चुकला की चक्क एएन
अरे सफिक्स चुकला की चक्क एएन ऐवजी इएन झाले....
आज संगणकातील कचरा (नको
आज संगणकातील कचरा (नको असलेल्या फाईल्स) साफ करताना हे सोने (Google IME Tool setup) मिळाले!!!
Google IME Tool हे एक उत्तम software आहे. Google Chrome सारखे browsers, Microsoft Word/Excel/Powerpoint, Paint यासारख्या कोणत्याही software मध्ये offline मराठी टंकलेखन करता येते!
https://goo.gl/dym85c
"विक्षिप्त_मुलगा" यांनी
"विक्षिप्त_मुलगा" यांनी कचऱ्यातून काढलेले सोने नक्की सोनेच आहे का याची खात्री करून घ्यावी. कारण ते सॉफ्टवेअर इंस्टॉल होत नाहीये. बराह आणि गुगल आय.एम.ई हे अनेकांचे "पहिले प्रेम" असल्यामुळे त्यातून त्यांना अजूनही बाहेर पडता येत नसावे असे वाटते.
_____
कोणते शब्द घ्यावेत व ते नियमात कसे बसवावे या बाबत अजूनही काही शंका असाव्यात असे वाटते. म्हणून "मराठी लेखन कोश" या पुस्तकातील पान ५ पाहू.
या पानावर उदाहरण म्हणून दिलेले शब्द हंस्पेल नियमात असे बसतील…
गुढी/ek
गुढ्या
गुढ्यां/an
दगड
दगडा/ek
दगडां/an
तराजू/ek
तराजूं/an
दासी/ek
दासीं/an
थरकाप
थरकापा/ek
कोय
कोई/ek
कोयी/ek
कोई
कोयी
कोईं/an
कोयीं/an
द्रव्य
द्रव्या/ek
द्रव्ये
द्रव्यां/an
बाकी/ek
बाक्या
बाक्यां/an
यात लक्षात घेण्याची गोष्ट अशी की दगड शब्दाचे एकवचनी सामान्यरूप मूळ शब्दापेक्षा वेगळे असल्यामुळे त्याच्या ३ नोंदी होतील तर दासी शब्दाच्या फक्त २ नोंदी पुरेश्या आहेत.
दगड
दगडा/ek
दगडां/an
दासी/ek
दासीं/an
कारण ते सॉफ्टवेअर इंस्टॉल होत
कारण ते सॉफ्टवेअर इंस्टॉल होत नाहीये. .......
घोर निराशा!!! मला वाटले माझ्याकडे आधीच install असल्याने 'कोणतेही अद्यतन उपलब्ध नाही' (No update available) असे दिसते आहे.
मायबोलीकर, क्षमस्व!
हंस्पेल पॅकेज वापरून शब्दाचा
हंस्पेल पॅकेज वापरून शब्दाचा उलट प्रवासही शक्य होतो. म्हणजे "घोड्य़ाचा" असा शब्द दिला की त्याचे मूळ रूप म्हणजे "घोडा" हा शब्द आपण या पानावर दिलेला ४ ओळींचा पायथॉन कोड वापरून मिळवू शकतो. याचा अर्थ "घोड्याचा युद्धात उपयोग होतो.” हे वाक्य कंप्युटर "घोडा + युद्ध" अशा अर्थाने घेईल व घोड्याचा युद्धाशी संबंध जोडेल. ह्याला NLP (एन. एल. पी.) "नॅचरल लँग्वेज प्रोसेसिंग" म्हणतात. इंग्रजीतील nltk, spacy, gensim या तंत्रांनी खूप मोठी उंची गाठली आहे. मराठीविषयी काही न बोललेलेच चांगले.
एन.एल.पी. वापरून कंप्युटर जे शिकतो ते फार प्राथमिक दर्जाचे असते. म्हणजे "भिकू म्हात्रेने घोड्याचा चाप दाबला.” हे वाक्य आपल्यापैकी अनेकांना समजेल तर काहींना समजणार नाही तर कंप्युटरला कसे कळावे? कारण यात घोडा शब्द बंदूक या अर्थाने वापरला आहे आणि त्याला "सत्या" या चित्रपटाचा संदर्भ आहे. सध्याच्या संगणकाने हे देखील गेल्या ४ – ५ वर्षात साध्य केले आहे त्याला म्हणतात आर्टीफिशीयल इंटलिजंस (AI – Artificial Intelligence ) काही वाचकांना सहज समजणारे संदर्भ कॉम्प्युटरला शिकवण्या करता गेली कित्येक वर्षे शेकडो तज्ज्ञ काम करत आहेत हे जाता जाता नमूद करावेसे वाटते. शिकवण्याच्या या क्लासला दोन गोष्टी लागतात. १) भरपूर डेटा आणि २) डेटा प्रोसेस करण्याकरता पॅकेजेस. वर उल्लेख केलेली nltk, spacy, gensim यासारखी पॅकेजेस थोड्याफार बदलानंतर मराठीसाठी देखील वापरता येतील. पण डेटा कुठून आणणार? मराठी विकिपीडिया हा मोठा आधार आहे, पण त्यातही फार मोठे लेख नाहीत. मराठी ब्लॉगविश्व सध्या मृतवत आहे. १० वर्षांनंतर देखील युनिकोडचा पूर्णपणे स्वीकार झालेला नाही. जे थोडेफार लेखन आहे ते कॉपीराईटच्या जाळ्यात अडकलेले आहे.
फक्त मराठीच नव्हे तर जगातील बहुतेक भाषांचे भवितव्य आता ते भाषिक तंत्रज्ञानाचा स्वीकार किती वेगाने करतात यावर अवलंबून असणार आहे.
डेटा कुठून आणणा>> खरय,
डेटा कुठून आणणा>> खरय, स्रोताअभावी सगळ डेव आणि टेस्ट नहि करत येणार
एक शन्का: synthetic data generate करुन सुरु वातीला primary training model develop and test करता येइल का?
अर्थात ते कित्पत अचुक असेल ते नाही सन्गता येनार
हिंदीत मराठीसारखे विभक्ती
हिंदीत मराठीसारखे विभक्ती प्रत्यय नसल्यामुळे त्यातील सफिक्स रूल्स अगदी सोपे आहेत. ते येथे पाहता येतील. उदाहरण म्हणून 'N' आणि 'O' या नावाचे हे दोन रूल्स पाहू.
SFX N Y 2
SFX N ी ियाँ ी
SFX N ी िओं ी
SFX O Y 3
SFX O ी िओं ी
SFX O ई इओं ई
SFX O ई इयाँ ई
हे रूल्स खाली दिलेले तीन शब्द वापरत आहेत असे समजू.
कली/N
भाई/O
धोबी/O
कली शब्दापासून दोन शब्द (कलियाँ, कलिओं) भाई शब्दापासून दोन (भाइओं, भाइयाँ) पण धोबी शब्दापासून फक्त एक शब्द बनतो. (धोबिओं)
सफिक्स रुल्ससारखे प्रिफीक्स
सफिक्स रुल्ससारखे प्रिफीक्स रुल्सदेखील वापरता येतील. मुख्यमंत्री, प्रधानमंत्री, अर्थमंत्री असे शब्द b आणि & हे दोन रूल वापरून बनवता येतील. "अर्थ" प्रिफिक्स वरच्या b रुलमध्ये न टाकता त्याचा स्वतंत्र रूल का बनविला? त्याचे कारण अर्थ शब्दाने इतर काही शब्द (अर्थशास्त्र, अर्थचिंता) बनतात त्यांच्या मुख्य वा प्रधान शब्दांशी काही संबंध नाही. म्हणून हे दोन रूल वेगवेगळे हवेत.
PFX b Y 4
PFX b 0 मुख्य .
PFX b 0 प्रधान .
PFX b 0 महा .
PFX b 0 उप .
PFX & Y 1
PFX & 0 अर्थ .
डिक्शनरीतील नोंदः
मंत्री/&b
मन्त्री/&b
चिंता/@m=&
शास्त्र/`&
प्रत्येक रूल व त्यात बसणारे शब्द ही पायथॉन स्क्रिप्ट वापरून अभ्यासता येतील.
_____
synthetic data generate करण्याची "किल्ली" यांची सूचना आहे. असे आभासी साहित्य निर्माण करणे सोपे नाही. व तसे करून फायदा नाही कारण त्यावर बनलेले मॉडेल तितकेसे विश्वासार्ह नसेल.
सिंथेटिक डेटा तयार करण्यासाठी देखील हंस्पेल रूल बनविणे आणि डिक्शनरीतील शब्द टॅग करणे जरुरी आहे.
"बसणे" या क्रियापदापासून खाली
"बसणे" या क्रियापदापासून खाली दाखविलेले सुमारे ८५ शब्द हंस्पेल रूल वापरून तयार केले आहेत. या प्रकाराला पूर्वी माझा मुख्य आक्षेप हा होता की असे "तयार केलेले" शब्द लोकांच्या लिहण्या/ बोलण्यात नसतात, तेव्हा ते डिक्शनरीत घेऊ नयेत. पण हे शब्द पाहिल्यावर लक्षात आले की यातील बहुतेक सर्व शब्द आपण कधी ना कधी वापरले आहेत. काही शब्द बोली भाषेत वापरलेले पाहिले आहेत. त्यामुळे हे रूल स्वीकारण्यास काहीच हरकत नसावी.
बस
बसण्या
बसण्याच
बसण्याचा
बसण्याची
बसण्याचे
बसण्यात
बसण्यानंतर
बसण्याने
बसण्यामागे
बसण्याला
बसण्यावर
बसण्याशी
बसण्यास
बसण्यासाठी
बसण्याही
बसण्याहून
बसलेल्या
बसलेल्यां
बसलेल्यांच
बसलेल्यांचा
बसलेल्यांची
बसलेल्यांचे
बसलेल्यांत
बसलेल्यांनंतर
बसलेल्यांना
बसलेल्यांनी
बसलेल्यांनो
बसलेल्यांमागे
बसलेल्यांला
बसलेल्यांवर
बसलेल्यांशी
बसलेल्यांस
बसलेल्यांसाठी
बसलेल्यांही
बसलेल्यांहून
बसलेल्याच
बसलेल्याचा
बसलेल्याची
बसलेल्याचे
बसलेल्यात
बसलेल्यानंतर
बसलेल्याने
बसलेल्यामागे
बसलेल्याला
बसलेल्यावर
बसलेल्याशी
बसलेल्यास
बसलेल्यासाठी
बसलेल्याही
बसलेल्याहून
बसल्या
बसल्यां
बसल्यांच
बसल्यांचा
बसल्यांची
बसल्यांचे
बसल्यांत
बसल्यांनंतर
बसल्यांना
बसल्यांनी
बसल्यांनो
बसल्यांमागे
बसल्यांला
बसल्यांवर
बसल्यांशी
बसल्यांस
बसल्यांसाठी
बसल्यांही
बसल्यांहून
बसल्याच
बसल्याचा
बसल्याची
बसल्याचे
बसल्यात
बसल्यानंतर
बसल्याने
बसल्यामागे
बसल्याला
बसल्यावर
बसल्याशी
बसल्यास
बसल्यासाठी
बसल्याही
बसल्याहून
या सर्व शब्दांना "च" आणि "ही" वापरून ८५ * ३ = २५५ शब्द बनविता येतील. पण तसे करण्यात अर्थ नाही. कारण आपण स्पेल-चेकमध्ये राईट क्लिकवर फार तर ५ – ६ शब्द दाखवू शकतो. त्यात सर्वात योग्य शब्द प्रथम दिसला पाहिजे आणि त्यासाठी डिक्शनरीचा आकार प्रमाणात ठेवावा.
# cat mr_IN3.aff
SFX P Y 5
SFX P 0 ण्या/QeZ .
SFX P 0 ल्या/QeZ .
SFX P 0 ल्यां/QaZ .
SFX P 0 लेल्या/QeZ .
SFX P 0 लेल्यां/QaZ .
SFX Q Y 4
SFX Q 0 साठी .
SFX Q 0 नंतर .
SFX Q 0 वर .
SFX Q 0 मागे .
SFX Z Y 2
SFX Z 0 च .
SFX Z 0 ही .
SFX e Y 9
SFX e 0 स .
SFX e 0 ला .
SFX e 0 ने .
SFX e 0 शी .
SFX e 0 हून .
SFX e 0 चा .
SFX e 0 ची .
SFX e 0 चे .
SFX e 0 त .
SFX a Y 12
SFX a 0 स .
SFX a 0 ला .
SFX a 0 ना .
SFX a 0 नी .
SFX a 0 शी .
SFX a 0 ही .
SFX a 0 हून .
SFX a 0 चा .
SFX a 0 ची .
SFX a 0 चे .
SFX a 0 त .
SFX a 0 नो .
अनेकवचनी e आणि एकवचनी a हे दोन रूल आपण पूर्वी पाहिले आणि वापरले आहेत. P, Q आणि Z हे तीन रूल नवीन आहेत. ते समजून घेण्याकरता डिक्शनरीत टॅग केलेला शब्द कसा दिसेल ते पाहू.
cat mr_IN3.dic
1
बस/P
“बस" या शब्दाला P हा टॅग लावल्यामुळे "बसल्या" , “बसलेल्या" असे शब्द तयार होतात. आता "ल्या" या सफिक्सला Q आणि Z चे शेपूट लावले आहे, त्यामुळे "बसल्यावर", “बसलेल्यांसाठी" असे शब्द तयार झाले. त्याचबरोबर "बसल्याच" आणि "बसलेल्याही" असे शब्द देखील मिळाले. “बसच" आणि "बसही" असे दोन शब्द हवे असतील तर डिक्शनरीतील नोंद थोडी बदलावी लागेल. ती अशी दिसेल.
बस/PZ
अशा प्रकारे डिक्शनरीतील टॅग केलेले शब्द आणि अफिक्स/ सफिक्स रूल्स एकदमच डेव्हलप करावे लागतील असे दिसते.
मस्त माहिती शन्तनूजी, मी हा
मस्त माहिती शन्तनूजी, मी हा धागा नियमीत वाचते..
रोचक आहे,
एक मात्र खरं की कामाचा आवाका खुप मोठा आहे ह्या प्रकल्पामध्ये..
एकदा डीटेल मध्ये अभ्यासाव लागणार हे प्रकरण
राम ह्या शब्दाचे सामान्यरूप
राम ह्या शब्दाचे सामान्यरूप "रामा" आणि अनेकवचनी सामान्यरूप "रामां" असे होईल. त्या शब्दांना "चा, ची , चे" असे विभक्ती प्रत्यय लागून पुढचे सर्व शब्द बनतात. त्यासाठी "आ" आणि "आं" असे दोन सफिक्स रुल आवश्यक आहेत. यातील पहिला एकवचनी "e" तर दुसरा बहुवचनी "a" या रुलपर्यंत घेऊन जातो. हे जे "नेस्टींग" आहे ते हंस्पेल इंजिनचे बलस्थान आहे. आपण या वैशिष्ट्यपूर्ण रूलला "F" असे नाव देवूया.
SFX F Y 2
SFX F 0 ा/e .
SFX F 0 ां/a .
डि्शनरीतील नोंदः
राम/F
बाळ/F
हाल/F
बाळ शब्दापासून तयार होणारे शब्दः
बाळ
बाळा
बाळाचा
बाळाची
बाळाचे
बाळात
बाळाने
बाळाला
बाळाशी
बाळास
बाळाहून
बाळां
बाळांचा
बाळांची
बाळांचे
बाळांत
बाळांना
बाळांनी
बाळांनो
बाळांला
बाळांशी
बाळांस
बाळांही
बाळांहून
तयार शब्दापासून मूळ शब्द देखील मिळवता येतो. याला आपण शब्दांचे "रिव्हर्स इंजिनिअरींग" म्हणू. त्यासाठी पायथॉन कोडः
import hunspell
hobj = hunspell.HunSpell('mr_IN3.dic', 'mr_IN3.aff')
for x in hobj.stem('बाळांशी'):
print (x.decode('utf-8')) ## बाळ
मराठीतील नियम क्रमांक ८.१ हा
मराठीतील नियम क्रमांक ८.१ हा दीर्घोपान्त्य शब्दांना लागू होतो. हा नियम आपण हंस्पेल रूलमध्ये बसवूया.
नियम ८:
८.१उपान्त्य दीर्घ ई-ऊ असलेल्या मराठी शब्दांचा उपान्त्य ई-कार किंवा ऊ-कार उभयवचनी सामान्यरूपाच्या वेळी ऱ्हस्व लिहावा.
उदाहरणार्थः गरीब - गरिबाला; चूल - चुलीला, चुलींना;
अपवाद - दीर्घोपान्त्य तत्सम शब्द.
उदाहरणार्थ: परीक्षा - परीक्षेला, परीक्षांना; दूत - दूताला, दूतांना.
यातील दूत हा शब्द राम या शब्दासारखा चालेल. म्हणून त्याला तोच टॅग देता येईल.
राम/F
दूत/F
पण चूल, मूल या शब्दांसाठी हा रूल बनवला.
SFX H Y 4
SFX H ूल ुला/QZe ूल
SFX H ूल ुलां/QZa ूल
SFX H ीब िबा/QZe ीब
SFX H ीब िबां/QZa ीब
यातील पहिला रूल "चूल" शब्दाला तर दुसरा रूल "गरीब" शब्दाला लागू होतो. ८.१ या नियमात बसणारे शब्द मिळतील तसे H हा रूल वाढत जाईल. त्याला इलाज नाही. नेमका उपान्त्य ईकार /ऊकार रेग्युलर एक्स्प्रेशन वापरून निवडता येईलही पण त्यात बदल करणे शक्य होईल की नाही हे इतर तज्ज्ञ सांगू शकतील. तोवर वर दिलेली पद्धत वापरावी लागेल.
गरीब/H
मूल/H
चूल/H
वर दिलेल्या नियमात एक चूक आहे
वर दिलेल्या नियमात एक चूक आहे. ती म्हणजे चूल शब्दाचे सामान्यरूप "चुला" असे न होता "चुली" झाले पाहिजे पण "मूल" शब्दाचे सामान्यरूप "मुला" असे होईल. तर दूत शब्दाचे "दूता" असे. थोडक्यात दूत, चूल आणि मूल हे तीनही शब्द वेगवेगळ्या पद्धतीने चालतात आणि त्यांचे सामान्यरूप बनविण्यासाठी वेगवेगळे रूल्स लिहावे लागतील. हे टेक्निकली आणि प्रॅक्टिकली शक्य नाही. सामान्यरूपाला प्रत्यय लावल्यावर त्याचेही सामान्य रूप करायचे आहे. म्हणजे "मूल" या शब्दावरून "मुलामागे" आणि पुढे "मुलामागचा" हे दोन शब्द हंस्पेल कसे तयार करेल? यासाठी एक पाऊल मागे जाऊन सुरुवातीला जो ऍप्रोच ठेवला होता तसा ठेवावा लागेल. म्हणजे डिक्शनरीत २ (किंवा ३) शब्द सामान्यरूपासह ठेवावे.
मूल
मुला/e
मुलां/a
डिक्शनरीत फक्त एक मूळ शब्द ठेवून बाकी सर्व शब्द प्रोग्रॅमॅटिकली तयार करण्याचे माझे स्वप्न हे स्वप्नच राहणार असे दिसते. कदाचित या सर्व कारणांमुळे अजून कोणी मराठी हंस्पेल रूल बनविण्याच्या भानगडीत पडलेला नसावा. मराठी भाषा (मराठी माणसांप्रमाणेच) नियमात बसविणे कठीण आहे हे सप्रमाण सिद्ध झाले.
बरेचसे विभक्ती प्रत्यय एकवचन
बरेचसे विभक्ती प्रत्यय एकवचन व बहुवचन असे दोन्हीकडे असल्यामुळे त्यांना वेगळे काढून c असे नाव दिले. 'ने' हा प्रत्यय फक्त एकवचनात दिसतो म्हणून त्याला a नाव दिले तर 'नो’, 'ना’, 'नी' फक्त बहुवचनात म्हणून त्यांच्या ग्रुपला b असे नाव दिले. टॅग करताना कॉमन + एकवचनी किंवा कॉमन + बहुवचनी असा टॅग जोडावा लागेल. म्हणजे 'मूल' शब्द डिक्शनरीत असा दिसेल. असे करण्याचा नेमका फायदा काय होईल ते सांगणे कठीण आहे. ओपन सोर्स सॉफ्टवेअरमध्ये कम्युनिटीला काय वाटते याला महत्त्व असते. म्हणून या विषयात मी लोकांच्या मताचा अंदाज (मिळाल्यास!) घेणार आहे.
तसेच काही प्रत्यय विशेष वापरले जात नाहीत. आपण 'घोड्याई', 'घोड्याआ' असे म्हणत नाही. तेव्हा असे शब्द मिळाले की खालील प्रत्ययांसाठी नवीन रूल लिहीता येईल. तोवर सध्यातरी हे विभक्ती प्रत्यय बाद समजावेत.
द्वितीया ते
तृतीया ए , ही
पंचमी ऊन
सप्तमी ई, आ
_____
प्राथमिक पातळीवरील सफिक्स / प्रीफिक्स रूल्स असे दिसतील.
SFX P Y 5
SFX P 0 ण्या/QZac .
SFX P 0 ल्या/QZac .
SFX P 0 ल्यां/QZbc .
SFX P 0 लेल्या/QZac .
SFX P 0 लेल्यां/QZbc .
SFX Q Y 5
SFX Q 0 साठी/c .
SFX Q 0 नंतर/c .
SFX Q 0 वर/c .
SFX Q 0 मागे .
SFX Q 0 माग/c .
SFX Z Y 2
SFX Z 0 च .
SFX Z 0 ही .
SFX c Y 9
SFX c 0 स .
SFX c 0 ला .
SFX c 0 शी .
SFX c 0 हून .
SFX c 0 चा .
SFX c 0 ची .
SFX c 0 चे .
SFX c 0 च्या .
SFX c 0 त .
SFX a Y 1
SFX a 0 ने .
SFX b Y 3
SFX b 0 ना .
SFX b 0 नो .
SFX b 0 नी .
PFX m Y 4
PFX m 0 मुख्य .
PFX m 0 प्रधान .
PFX m 0 महा .
PFX m 0 उप .
PFX & Y 1
PFX & 0 अर्थ .
डिक्शनरीतील नोंदी अशा दिसतील.
मूल
मुला/QZac
मुलां/QZbc
बसणे
बस/P
मंत्री/&m
मंत्र्या/&QZacm
मंत्र्यां/&QZbcm
'करीत' असे टाईप केले की ऍटो
'करीत' असे टाईप केले की ऍटो करेक्ट ते उलटवून 'करित' असे करतो आहे. शुद्ध शब्द टाईप केल्यावर तो ऍटो करेक्टद्वारे अशुद्ध करण्याचा हा प्रकार हास्यास्पद आहे. हे फ्री आणि ओपन सोर्स सॉफ्टवेअर आहे हे समर्थन लंगडे आहे. 'करी' म्हणजे ताकाची आमटी या अर्थाने हा शब्द वापरला तर त्याचे रूप करित, करिचा असे होऊ शकेल. असा युक्तिवाद केस जिंकण्यासाठी कोर्टात केला जातो. इथे मात्र sed आणि grep कमांड वापरून डिक्शनरी आणि ऍटो करेक्ट सुधारणे हा मार्गच योग्य!
!sed -i 's/\bकरित\b/करीत/g' mr_IN.dic
! grep -v '\bकरित\b' DocumentList.xml > new.xml
! mv new.xml DocumentList.xml
युबंटू लाईव्ह सीडीची नवीन
युबंटू लाईव्ह सीडीची नवीन आवृत्ती आता उपलब्ध आहे. युबंटूच्या १८.०४ या व्हर्जनमध्ये मराठीसाठी अनुकूल बदल करून बनविलेल्या नवीन युबंटूला "रिमास्टर" असेही म्हणतात. यात लिबर ऑफिसचा स्पेल चेक व फायरफॉक्सचे मराठी स्पेल चेक ऍड ऑन अर्थात आहेच. Audacity आणि GIMP ही मूळ युबंटूत नसलेली सॉफ्टवेअर यात आधीच टाक़ून ठेवलेली आहेत.
त्याव्यतिरिक्त दोन मुख्य सुधारणा केल्या आहेत.
१) यशोमुद्रा, जैनी, लैला यासारखे अनेक युनिकोड फॉन्ट
२) मराठी / इंग्लिश दोन्ही भाषेत सहज टाईप करता यावे म्हणून F9 ही टॉगल की ऍड केली. "प्रमुख" सॉफ्टवेअरमध्ये F9 हीच की वापरली आहे. म्हणून युबंटूमध्ये देखील तीच ठेवली.
s3.ap-south-1.amazonaws.com/kagapa/ubuntu-18.04-v7-2-remaster.iso
वर दिलेली फाईल डाऊनलोड करून घ्या. याची साईज खूप मोठी आहे. (सुमारे दोन जी.बी. ) त्यानंतर "निरो" या सॉफ्टवेअरमध्ये "Burn Image to Disk” असा ऑप्शन वापरून युबंटूची सी.डी. तयार करा. ही सी.डी. कोणत्याही कॉम्प्युटरमध्ये टाकून तो सुरू केला की विंडोजच्या ऐवजी युबंटू सुरू होईल. सिडी काढून कॉम्प्युटर परत सुरू केला की पुन्हा विंडोज. याला लाईव्ह सिडी असे म्हणतात. याची चर्चा उपक्रमाच्या या पानावर वाचता येईल. कोणाला जर याचा सोर्स कोड पाहायचा असेल तर तो येथे उपलब्ध आहे.
s3.ap-south-1.amazonaws.com
s3.ap-south-1.amazonaws.com/kagapa/ubuntu-18.04-v7-2-remaster.iso
वर दिलेली फाईल डाऊनलोड करून घ्या. याची साईज खूप मोठी आहे. (सुमारे दोन जी.बी. ) त्यानंतर "निरो" या सॉफ्टवेअरमध्ये "Burn Image to Disk” असा ऑप्शन वापरून युबंटूची सी.डी. तयार करा. ही सी.डी. कोणत्याही कॉम्प्युटरमध्ये टाकून तो सुरू केला की विंडोजच्या ऐवजी युबंटू सुरू होईल. सिडी काढून कॉम्प्युटर परत सुरू केला की पुन्हा विंडोज. याला लाईव्ह सिडी असे म्हणतात. याची चर्चा उपक्रमाच्या या पानावर वाचता येईल. कोणाला जर याचा सोर्स कोड पाहायचा असेल तर तो येथे उपलब्ध आहे.>> हे भारी आहे.. करुन बघायला पाहिजे एकदा..
एका मैत्रिणीला ऑफलाईन मराठी
एका मैत्रिणीला ऑफलाईन मराठी टायपिंगसाठी मदत हवी होती. तिला हेडरमधली भाषाइंडियाची लिंक पाठवली. पण आता त्या लिंकवर एरर येते आहे.
भाषाइंडियाच्या होम-पेजवरून गेलं तरी तसंच होतं.
प्रमुख-आयएमई तरी नीट चालतं का? असल्यास तिला त्याची लिंक पाठवेन.
प्रमुख-आयएमई तरी नीट चालतं का
प्रमुख-आयएमई तरी नीट चालतं का>>> हो
भाषाइंडियाच्या होमपेजवरून मी
भाषाइंडियाच्या होमपेजवरून मी मायक्रोसॉफ्टच्या भाषाइंडिया विभागात पोहोचू शकलो.
https://www.microsoft.com/en-in/bhashaindia/downloads.aspx
इथल्या व्यवस्थापकांना विनंती की त्यांनी भाषाइंडियाचा बदलेला पत्ता मूळ लेखात शक्य झाल्यास नमूद करावा.
ड्युप्लिकेट शब्द शोधण्यासाठी
ड्युप्लिकेट शब्द शोधण्यासाठी एक चांगले सॉफ्टवेअर येथे उपलब्ध आहे.
https://github.com/mtrevisan/Hunspeller
यात असे दिसते की "मुलांचा" हा शब्द अनेकवचनी रूल वापरून तयार होत आहेच पण तो आधीही जमा झालेला आहे. (ओळ क्रमांक १३७१८०) "हन्स्पेल नियमाला प्राधान्य" या नवीन धोरणाप्रमाणे रूल ठेवून आधीचा शब्द (ओळ क्रमांक १३७१८० वरील) काढून टाकावा.
अर्थात ड्युप्लिकेट शब्द डिक्शनरीत राहिले तरी काही फार फरक पडत नाही. पण आकार विनाकारण वाढतो. त्याला किती महत्त्व द्यायचे ते ज्याचे त्याने ठरवावे. वरील चित्रात "Extract wordlist" असा पर्याय आहे. तो वापरला की रूल वापरून बनलेले शब्द तसेच इतर शब्द यांची एकत्रित यादी आपोआप तयार होईल. ड्युप्लिकेट काढण्याकरता लिनक्स मधील सॉर्ट कमांडमध्येच "युनिक" पर्याय वापरता येतो तो असा...
sort -u t1.txt > x1.txt
प्रुफिंग टूल्स जीयुआय मध्ये ही सुविधा लवकरच उपलब्ध होईल. तोवर हे सॉफ्टवेअर वापरून पाहू शकता.
१५ व १६ फेब्रुवारी २०१९ या
१५ व १६ फेब्रुवारी २०१९ या दोन दिवशी "ओपन सोर्स" विषयावर पुण्यात अधिवेशन असून मायबोलीवरील ज्यांना मराठी स्पेलचेक या विषयात रस असेल त्यांनी संपर्क केल्यास आपली तेथे भेट होऊ शकेल.
http://gnunify.sicsr.ac.in/
शक्य झाले तर मी "हन्स्पेल" या विषयावर छोटे व्याख्यानही देईन.
इथे वाचून मी प्रमुख-आयएमई
इथे वाचून मी प्रमुख-आयएमई वापरायला सुरूवात केली. दोन-एक महिने चांगलं चाललं. मात्र परवापासून ते अचानक काम करेनासं झालं आहे. मराठी टायपिंगचा पर्याय निवडला तरी रोमन अक्षरंच उठतात.
पीसी रिस्टार्ट करून पाहिला; प्रमुख-आयएमई अन-इन्स्टॉल करून परत इन्स्टॉल करून पाहिलं तरी काही उपयोग नाही.
मी त्यांच्या वेबसाईटवरच्या contact form मार्फत त्यांना ही समस्या कळवली. त्यांनाही त्याचं उत्तर माहिती नाही.
इथे कुणी काही सांगू शकेल का? कुणाला असा काही अनुभव आला आहे का?
मिसिंग बरहा…
बरहानं असा त्रास कधीही दिला नाही. 
माझ्या बाबतीत असेच थोडे आकृती
माझ्या बाबतीत असेच थोडे आकृती या सॉफ्टवेअर मध्ये झाले. दोन वर्षे पूर्वी पर्यंत ते नीट वागत होते. पण पीसी मध्ये विंडोज 7install केल्या पासून आधीच्या फाइल्स आंडु गुंडु दिसत आहेत.. कंपनी ला संपर्क होऊ शकला नाही
नुकत्याच हाती आलेल्या
नुकत्याच हाती आलेल्या वृत्तानुसार बरहाचं ताजं व्हर्जन (१०.१०) त्यांच्या वेबसाईटवरून फ्री डाऊनलोडसाठी उपलब्ध आहे.
मी डाऊनलोड करून वापरायला सुरूवात केली.
बरहाचं ताजं व्हर्जन (१०.१०)
बरहाचं ताजं व्हर्जन (१०.१०) ची Link पण दिली असती तर अधिक बरे झाले असते माझ्यासारख्या आळशी पामरांना !
WordPress मध्ये मराठी टंकलेखन
WordPress मध्ये मराठी टंकलेखन कसे करावे, याबद्दल कुणाला माहिती आहे का?
मी आत्ताच एका नवीन संगणकावरून
मी आत्ताच एका नवीन संगणकावरून प्रमुख आय. एम. ई. डाऊनलोड करून वापरून पाहिले. मला मराठी टाईप करण्यात काहीही समस्या आलेली नाही. स्पेल चेक देखील वापरून पाहिला. तो देखील नीट चालत आहे. “प्रमुख आयएमई" व "मराठी स्पेलचेक" या दोन गोष्टींची आडून आडून तसेच उघड उघड जाहीरात करण्यात मला संकोच (लाज म्हणा हवं तर) वाटत नाही. बराहप्रेमी समजून घेतील अशी आशा आहे.
बराहचे ३० दिवस मोफत चालणारे सॉफ्टवेअर येथे उपलब्ध आहे.
http://baraha.com/v10/baraha_setup.php
एक महिनाभर ते (फुकट) वापरता येईलही. पण त्यानंतर काय? बराहचा सेटअप प्रमुखपेक्षा खूपच जास्त आहे. त्याला बरीच मेमरी लागते. प्रमुख इतके हलके - फुलके (lightweight) सॉफ्टवेअर मी कधीच पाहिलेले नाही.
"आकृती" या सॉफ्टवेअरची चर्चा याआधी झालेली नाही कारण त्यात युनिकोड सपोर्ट नाही. माझ्या माहितीप्रमाणे ते मोफत नाही. ओपन सोर्स तर नाहीच नाही - म्हणजे त्यात काही बदल /सुधारणा करणे आपल्या आवाक्यात नाही.
बराह किंवा प्रमुख वापरून फक्त वर्डप्रेस नव्हे तर कुठेही मराठीत टाईप करता येते. पण माझ्यामते लिबर ऑफिसच्या रायटरमध्ये आधी टाईप करून मग ते हवे तिथे कॉपी - पेस्ट करणे जास्त सोयीचे ठरेल.
गुगल ट्रान्स्लेट
गुगल ट्रान्स्लेट
भाषांतरासाठी ही साईट वापरून पाहिली.
https://translate.google.com
काही निरीक्षणे नोंदवून ठेवत आहे.
१) हंस्पेल नियमांचा अभाव
हंस्पेल नियम तयार झाले की त्यांचा गुगलसारख्या मोठ्या कंपन्यांनादेखील फायदा होऊ शकेल. उदाहरण म्हणून गुगल ट्रांस्लेट या अवजाराचा उपयोग करून तयार होणारे मराठी शब्द पहा.
त्रिज्यामध्ये
व्यापारसाठी
त्रिज्या शब्दाचे सामान्यरूप "त्रिज्ये" असे असून शुद्ध शब्द "त्रिज्येमध्ये" असा आहे, "त्रिज्यामध्ये" नव्हे. व्यापार शब्दावरून "व्यापारसाठी" नव्हे तर "व्यापारासाठी" असा शब्द मिळतो.
२) इंग्रजी शब्दांचा सढळ वापर
फंडिंगच्या
कॅप्चर
इनपुटशी
असे भरपूर शब्द गुगलच्या भाषांतरात दिसतात. माझ्या स्पेलचेक डिक्शनरीत देखील असे बरेच शब्द आहेत हे मान्य. पण ते शब्द फक्त अशुद्ध शब्दांना पर्याय म्हणून राईट क्लिकवर दिसतात. म्हणजे "कैप्टन" शब्दावर उजवी टिचकी मारून त्याला "कॅप्टन" बनविणे - इतक्यापुरतेच माझी डिक्शनरी मर्यादित आहे. भाषांतरात असे इंग्रजी शब्द जसेच्या तसे वापरणे गुगलसारख्या मोठ्या कंपनीला शोभत नाही.
३) भन्नाट भाषांतर
अमर्तिकीकरण
अनुप्रयोग
अशा शब्दांचा अर्थ मराठी कोषातदेखील सापडणे कठीण आहे. भाषांतर म्हणजे शब्दाला शब्द जोडणे नव्हे. त्यातील भावदेखील पोहोचला पाहिजे.
४) अशुद्ध मराठी
शेतकर्यां कडून
करणार्या
दौर्यात
या व अशा इतर अशुद्ध शब्दांविषयी काय बोलणार?
एक महिनाभर ते (फुकट) वापरता
एक महिनाभर ते (फुकट) वापरता येईलही. पण त्यानंतर काय? >>> नंतर, वापर सुरू ठेवू शकता, काही फीचर्स चालणार नाहीत, असा मला मेसेज आला होता. मला मुख्यत्वे आय.एम.ई.च लागतं. ते नीट चाललं तर तेवढं मला पुरेसं आहे. नाही चाललं तर मी तेवढं मॉड्युल सरळ विकत घेणार. (< २००० रु किंमत आहे.)
प्रमुख-आयएमईच्या निर्मात्याला मी संपर्क केला, माझा प्रॉब्लेम सांगितला, तर त्यालाही त्यावरचा उपाय माहिती नाहीये. थोडक्यात बरहाशिवाय माझ्याकडे सध्या तरी काही पर्याय नाही.
आपण बोलू तसे संगणकावर आपोआप
आपण बोलू तसे संगणकावर आपोआप टंकन होते, हा प्रकार मराठीत निर्दोष यायला अजून किती काळ लागेल ?
महितगारांनी सांगावे ही वि.
माझ्याकडे बरहा ९.३ आहे. ते
माझ्याकडे बरहा ९.३ आहे. ते Win7 वर व्यवस्थित चालतेय. Win८ किंवा Win १० वर test करून बघितले नाही.
९.३ चे मुक्तस्रोत लायसंस आहे असे दिसतेय.
'मायबोली' चे फोनेटिक टंकलेखन
'मायबोली' चे फोनेटिक टंकलेखन मला सर्वात जास्त आवडते पण त्याचा 'ऑफ-लाईन' पर्याय अद्याप उपलब्ध नाही. काय कारण असावे? का हा 'मायबोली'चा खडूसपणा म्हणायचा?
बापू करंदीकर
Pages