मोफत मराठी पुस्तकं | Page 2

बुकमार्क केले गेले आहे..

Submitted by पिंगू on 13 February, 2015 - 08:57

Log in or register to post comments

मस्त. मी बहिणाबाई वाचलं. खूप

मस्त. मी बहिणाबाई वाचलं. खूप नवीन गोष्टी कळल्या. धन्यवाद. आता खजिना उघडून दिल्याबद्दल.

Submitted by मोहना on 13 February, 2015 - 09:13

Log in or register to post comments

महाराष्ट्र साहित्य आणि

महाराष्ट्र साहित्य आणि संस्कृती मंडळ यांना अनेक धन्यवाद. अत्यंत उत्तम कार्य केले आहे.
हे कार्य आपल्याकडे पोचवण्याचे दुसरे उत्तम कार्य श्री आश्चिग यांनी केले आहे त्यांनाहि धन्यवाद.

Submitted by झक्की on 13 February, 2015 - 16:33

Log in or register to post comments

खुप खुप धन्यवाद

Submitted by अतुल ठाकुर on 13 February, 2015 - 22:20

Log in or register to post comments

धन्यवाद.

Submitted by अरुंधती कुलकर्णी on 13 February, 2015 - 22:29

Log in or register to post comments

खुप खुप धन्यवाद निवडक दहात

खुप खुप धन्यवाद
निवडक दहात

Submitted by सुजा on 14 February, 2015 - 00:52

Log in or register to post comments

मोगल दरबारची बातमीपत्रे,

मोगल दरबारची बातमीपत्रे, French Record (Relating to the History of the Marathas), PORTUGUESE MAHRATTA RELATIONS !!!

व्वा!! सहीच!!!! गेल्या वर्षा पासून मी स्वतःचीच एक डिजिटल लायब्ररी बनवली आहे आणि त्यात इतिहासाशी संबंधित संदर्भ ग्रंथ, आत्मचरित्र यांचे पीडीएफ घेतले आहेत गुटेनबर्ग, archive.org, इ वरून. पण ती सगळी इंग्रजी आहेत. हा मात्र खूप मोठा खजिना आहे, इतिहास, खगोलशास्त्र, तत्त्वज्ञान, सगळंच आहे इथे!

Submitted by जर्बेरा on 14 February, 2015 - 03:25

Log in or register to post comments

ध्न्यवाद!

Submitted by शोभनाताई on 14 February, 2015 - 22:24

Log in or register to post comments

वाह! अलीबाबाची गुहाच जणू

वाह! अलीबाबाची गुहाच जणू उघडून मिळाली. धन्यवाद!

Submitted by सहेली on 14 February, 2015 - 22:57

Log in or register to post comments

खुप खुप धन्यवाद..

Submitted by शिल्पा गडमडे on 15 February, 2015 - 04:15

Log in or register to post comments

पुस्तके स्कॅन केलेली आहेत.

पुस्तके स्कॅन केलेली आहेत. नॉट ट्रू ईबुक्स. त्यामुळे अगडबंब साईझ.
दुसरे, काही पुस्तकांच्या स्कॅनची क्वालिटी अत्यंत भिकार आहे. पानेच्यापाने अवाचनीय मजकूर. थोडा हिरमोड झाला.

Submitted by इब्लिस on 15 February, 2015 - 09:22

Log in or register to post comments

इब्लिस, भारतात बहुतेक सरकारी

इब्लिस, भारतात बहुतेक सरकारी डीजिटलायझेशनची हीच परिस्थिती असते. इलाज नाही.

Submitted by वरदा on 15 February, 2015 - 10:40

Log in or register to post comments

विश मजपाशी थोडा वेळ

विश मजपाशी थोडा वेळ असता..
काही पुस्तकं खरंच दुर्मिळ अन सुंदर आहेत. वाचून चक्क टाईप करून दिली असती..
रिटायर झालोच तर मोकळ्या वेळात करायच्या यादीत हे एक अ‍ॅडवून ठेवतो.

Submitted by इब्लिस on 15 February, 2015 - 12:37

Log in or register to post comments

इब्लिस, टाईप करण्यात काही

इब्लिस, टाईप करण्यात काही अर्थ नाही. इथे आवश्यकता चांगल्या देवनागरी OCRची आहे.

Submitted by aschig on 15 February, 2015 - 22:43

Log in or register to post comments

हे अगदीच मान्य @ आस्चिग.

हे अगदीच मान्य @ आस्चिग. अनेकदा देवनागरी ओसीआर हवे असे वाटले आहे. त्यावाचून काम अडले आहे.
परंतू ओसीआर डेव्हलपमेंट हा माझ्या कौशल्यांत बसणारा भाग नसल्याने, मला शक्य तेवढे करीन म्हणतो..

Submitted by इब्लिस on 15 February, 2015 - 22:47

Log in or register to post comments

ओ सी आर म्हणजे?

Submitted by नीधप on 15 February, 2015 - 23:08

Log in or register to post comments

ocr- optical character

ocr- optical character recognition

Submitted by जिज्ञासा on 15 February, 2015 - 23:10

Log in or register to post comments

हे काय असतं?

Submitted by नीधप on 15 February, 2015 - 23:15

Log in or register to post comments

ocr मुळे तुम्ही दस्त scan

ocr मुळे तुम्ही दस्त scan केलात की त्याचे word document (editable text) बनते

Submitted by डीविनिता on 15 February, 2015 - 23:31

Log in or register to post comments

चांगल्या दर्जाचे देवनागरी

चांगल्या दर्जाचे देवनागरी ओसीआर बहुदा उपलब्ध आहे असं आठवतंय.
कितीही प्रगत तंत्रज्ञान उपलब्ध असलं तरी टेन्डर्स, बजेट, प्रकल्प राबविण्यामागे बरेचदा असलेला कल्पकतेचा, कॉमन सेन्सचा अभाव वगैरे खास सरकारी घटक असले की ते तंत्रज्ञान वापरात आणलं जात नाही मग.....
देवनागरी सोडा, इंग्लिश पुस्तकं स्कॅन केली आहेत काही संस्थांनी - ती तर मरासासंमं पेक्षा दयनीय दर्जाने स्कॅन केली आहेत. पुस्तकांचे आधीच पिवळे पडलेले जीर्ण कागद ते लो रेझोल्युशनमधे अस्पष्ट स्कॅन.. वाचून वाचून डोळ्याची भोकं व्हायची वेळ येते... असोच.

Submitted by वरदा on 16 February, 2015 - 00:22

Log in or register to post comments

ह्म्म आले लक्षात. धन्स!

Submitted by नीधप on 16 February, 2015 - 00:25

Log in or register to post comments

Indisenz हे एक बऱ्यापैकी

Indisenz हे एक बऱ्यापैकी मराठी OCR आहे. किंमत खूप जास्त आहे आणि चुका देखील खूपच होतात. चुका कमी होण्यासाठी स्कॅनिंग ची क्वालिटी खूप चांगली असावी लागते. हे बरेच वेळखाऊ प्रकरण आहे.
मी एका पुस्तकाची PDF स्प्लीट करून सगळी पाने वेगळी केली. मग Gimp वापरून एक पान इमेज (PNG) मध्ये बदलले. हि इमेज मग Indisenz मध्ये आयात केली. मग त्याला शब्द ओळखायला लावले. एका पूर्ण पानाला साधारण २० सेकंद लागले. शेवटी जवळ जवळ ७०% शब्द चुकीचे निघाले. म्हणजे "विकास" ऐवजी "यिकास" "भारतीय" ऐवजी "मारतीय" अशा चुका झालेल्या. व च्या जागी य हि सगळ्यात जास्त चूक निघाली.

याला शिकवता येतं म्हणे. थोडा अजून प्रयत्न करून बघायला हवा. जास्त रीजोलुशन मध्ये स्कॅनिंग केलेलं असेल तर चुका खूपच कमी होतील.

Submitted by व्यत्यय on 17 February, 2015 - 10:28

Log in or register to post comments

टग्या, यापेक्षा प्रत्येक

टग्या,
यापेक्षा प्रत्येक पानावर खर्च केलेल्या वेळापेक्षा कमी वेळेत पानभर टंकता आले असते, असे वाटले का तुम्हाला? मुद्रितशोधनास प्रत्यक्ष मुद्रणापेक्षा जास्त वेळ खर्च होतो असे मला वाटते.

Submitted by इब्लिस on 17 February, 2015 - 13:05

Log in or register to post comments

अनेक वेबसाईट्सवर असलेले

अनेक वेबसाईट्सवर असलेले "कॅप्चा" प्रकरण हा ओसीआर एज्युकेशनचा भाग असतो असे ऐकले आहे. त्यात तुम्ही वाचून लिहिलेले वेड्यावाकड्या अक्षरांचे टंकन हे ओसीआर सॉफ्टवेअरच्या अधिक अचुक शब्दवाचनासाठी वापरले जाते. या कॅप्चामधे दोन भाग असतात, एकात अत्यंत वेडीवाकडी अक्षरे, व दुसर्‍यात तुलनेने सोपी अक्षरे.
या कॅप्चामुळे वेबसाईट्सवर बॉट लॉगिनचे प्रमाणही कमी होते, व ओसीआर सुधारणाही.

असो. धागा अचानक ओसीआरच्या चर्चेवर घसरतोय..

Submitted by इब्लिस on 17 February, 2015 - 13:12