शेक्सपिअर आणि संख्याशास्त्र

Submitted by मेघना. on 27 May, 2021 - 08:19

साल १९८४. नोव्हेंबर महिना चालू होता. शेक्सपिअर अभ्यासक डॉक्टर गॅरी टेलर ऑक्सफर्ड विद्यापीठातल्या बडलेयन लायब्ररीच्या एका कोपऱ्यात बसून एक कवितासंग्रह चाळत होते. बडलेयन लायब्ररीला हा हस्तलिखित कवितासंग्रह होता १७७५ सालचा. आणि त्यातल्या संग्रहित कविता होत्या त्याहीपूर्वीच्या, सतराव्या शतकातल्या. हे संकलन चाळताना टेलरची नजर एका कवितेवर पडली. ही कविता होती नऊ कडव्यांची. प्रत्येकी आठ ओळी म्हणजेच ७२ ओळींची ही कविता, ज्यात मोजून ४२९ शब्द होते. त्या कवितेच्या काही ओळी अशा..

Shall I die? Shall I fly
Lovers' baits and deceits,
sorrow breeding?
Shall I tend? Shall I send?
Shall I sue, and not rue
my proceeding?
In all duty her beauty
Binds me her servant for ever,
If she scorn, I mourn,
I retire to despair, joying never.

या संकलित संग्रहाच्या अनुक्रमणिकेमध्ये या कवितेचे श्रेयनाम होते ‘विल्यम शेक्सपिअर’! टेलर खूप रोमांचित झाले. ‘विल्यम शेक्सपिअर’ ची असूनही १९८४/८५ सालापर्यंत ही कविता कोणाच्या नजरेत भरली नव्हती. तसं पाहता शेक्सपिअरचे बहुतांशी लेखन १७ व्या शतकामध्येच सापडलेले होते. ही कविता जर खरोखरच शेक्सपिअरची असली तर त्याचा अर्थ जवळपास २-३ शतकानंतर त्याच्या नवीन लिखाणाचा शोध लागला असा असता आणि ही शेक्सपिअर अभ्यासकांसाठी अतिशय आनंदाची बाब असणार होती. या नव्या संशोधनामुळे साहित्यिक जगतात उत्साह निर्माण होईल अशी आशा त्यांच्या मनात निर्माण झाली. जवळपास आठवडाभर या कवितेचा नीट अभ्यास केल्यावर गॅरी टेलर आणि त्यांचे सहकारी स्टॅन्ली वेल्स यांची खात्री पटली की ही कविता शेक्सपिअरचीच. तसा त्यांनी उघड दावाही केला. या दाव्याने समस्त जगतात खळबळ माजवली. ही कविता समोर येताच तिला टेलरच्या अपेक्षेप्रमाणे लोकांचा उत्साहवर्धक प्रतिसाद मिळाला खरा, मात्र या त्यांच्या दाव्याला विरोध करणाऱ्यांची संख्या कमी नव्हती. विशेषतः बऱ्याच जाणकार अभ्यासकांनी याचा पाठपुरावा करत टेलरचे मुद्दे खोडून काढायला सुरुवात केली.

यादरम्यान येल विद्यापीठातल्या लायब्ररीमध्ये एका दुसऱ्या हस्तलिखितामध्ये हीच कविता असल्याची माहिती पुढे आली. मात्र, त्या संकलनात या कवितेच्या श्रेयनामावलीत कोणाचेही नाव नव्हते. जर इथेही शेक्सपिअरच्या नावे ही कविता असती, तर टेलरच्या दाव्याला सहज पुष्टी मिळाली असती. दुर्दैवाने तसे झाले नाही. याउलट बडलेयन लायब्ररीतल्या त्या संग्रहामधल्या कवींच्या माहितीवर काही अभ्यासकांनी आक्षेप नोंदवला.

अशी सगळी उलट सुलट चर्चा चालू असताना, स्टॅनफर्ड विद्यापीठातले संख्याशास्त्रज्ञ ब्रॅडली एफ्रोन आणि त्यांचा विद्यार्थी रोनाल्ड थिस्टेड यांनी याबद्दल (संख्या)शास्त्रीय पाठपुरावा करण्याचे ठरवले. याची कारणेही तशीच होती. या घटनेच्या आधी जवळपास दहा वर्षांपूर्वी, या दोघांनी शेक्सपिअरच्या विपुल शब्दभांडारासंदर्भात थोडा अभ्यास केला होता. त्यांनी असा प्रश्न विचारला, की जर एखादा नवीन साहित्याचा तुकडा समोर आला, तर समजणार कसं की ते लिखाण शेक्सपिअरचंच आहे म्हणून? (अर्थातच साहित्याच्या संदर्भामध्ये संख्याशास्त्रीय कसोट्या वापरण्याची ही काही पहिलीवाहिली घटना नव्हती. ही काही उदाहरणे आपण पुढेमागे कधीतरी पाहूच). याचे उत्तर देण्यासाठी एफ्रोन आणि थिस्टेड यांनी १९४३ साली प्रसिद्ध झालेल्या सर रोनाल्ड फिशर यांच्या एक शोधनिबंधाचा आधार घेतला. काय होता हा शोधनिबंध?

सी. बी. विल्यम्स नावाचे एक जीवशास्त्रज्ञ मलेशियामध्ये फुलपाखरांच्या विविध प्रजातींचा अभ्यास करत होते. त्यांच्या असं लक्षात आलं, की त्यांनी पकडलेल्या फुलपाखरांमध्ये काही विशिष्ट प्रजातींच्या फुलपाखरांची संख्या अधिक आहे, तर काहींची कमी. काही फुलपाखरे शेकड्याने सापडतात, काही हाताच्या बोटावर मोजण्याइतकी, तर काही विशिष्ट प्रजातीचे एखादेच. अशा परिस्थितीमध्ये, आपल्याला ‘न आढळलेल्या’ प्रजाती किती असाव्यात याबद्दल अंदाज बांधता येणं शक्य आहे का? एखाद्या विशिष्ट भागामध्ये फुलापाखरांच्या किती भिन्न प्रजाती आढळतील? काही गृहितकांच्या आधारावर काही जटिल गणिती सूत्राद्वारे या प्रश्नाचे उत्तर देण्याची पद्धत फिशर यांनी शोधून काढली, तोच हा शोधनिबंध. ही समस्या एफ्रोन आणि थिस्टेडच्या डोक्यात घोळत असलेल्या शेक्सपिअरच्या लिखाणाच्या प्रश्नाशी साधर्म्य असणारी होती. दरम्यानच्या काळात शेक्सपिअरच्या लिखाणाचे संगणकीकरण झाले होते. त्या आधारे या जोडगोळीने शेक्सपियरच्या तोपर्यंत माहीत असलेल्या समग्र साहित्यामध्ये कोणकोणते शब्द किती वेळा वापरले आहेत याचा सखोल अभ्यास केला. त्यावरून एक वारंवारीता तक्ता तयार केला. समग्र शेक्सपिअर साहित्यामधल्या एकूण ८८४,६४७ शब्दांपैकी ३१५३४ शब्द भिन्न आहेत. हा तक्ता खालीलप्रमाणे:

freq_table_1.png
(‘स्टॅटिस्टिक्स अँड ट्रूथ – सी. आर. राव’ या पुस्तकातून साभार)

त्याचा उपयोग करून त्यांनी असे प्रश्न विचारले – की अजून असे किती शब्द असतील जे शेक्सपिअरला माहीत होते, पण त्याने वापरले नाहीत? (फुलपाखरच्या समस्येचा विचार करता हा प्रश्न समांतर आहे – उदाहरणार्थ, अशा किती फुलपाखरांच्या नवीन प्रजाती आहेत ज्या असतील पण आपल्याला आढळल्या नाहीत?) शेक्सपिअरचे एखादे नवीन साहित्य आढळून आल्यास त्यापैकी किती शब्द त्याने आतापर्यंत न वापरलेले असतील? किती शब्द आधी एकदाच वापरले असतील इत्यादी इत्यादी. फिशरच्या वर उल्लेख केलेल्या शोधनिबंधातल्या जटिल गणिती ‘मॉडेल’ला अनुसरून त्यांनी या ‘distribution’ चा अंदाज व्यक्त केला. हा शोधनिबंध १९७६ मध्ये प्रसिद्ध झाला होता.

१९८४ मध्ये जेव्हा टेलरना ही नवीन कविता सापडली, तेव्हा या द्वयीला त्यांची आधीची मांडणी वापरुन पाहायची सुवर्णसंधी उपलब्ध झाली. त्यांनी त्यांचे मॉडेल वापरुन नवीन कवितेतल्या शब्दांच्या वारंवारीतेची पडताळणी केली. इतकेच नव्हे तर नवीन सापडलेली कविता इतर समकालीन प्रसिद्ध कवींच्या जास्त जवळ जाणारी आहे का, हे बघण्यासाठी इतर कवींच्या ‘पॅटर्न’शी देखील तुलना केली. खालील मांडणी त्याचा आढावा घेते.

freq_table_2.png
(‘स्टॅटिस्टिक्स अँड ट्रूथ – सी. आर. राव’ या पुस्तकातून साभार)

या सगळ्या अभ्यासातून त्यांना असं दिसलं, की तुलनात्मकरीत्या या कवितेतले शब्दप्रयोग हे बाकीच्या कवींपेक्षा शेक्सपिअरशी जास्त मिळतेजुळते आहेत. सांख्यिकीच्या नियमानुसार हा निष्कर्ष शब्दात मांडायचा झाल्यास असे म्हणता येईल, की ही कविता ‘शेक्सपिअरची नाहीच असे ठामपणे म्हणता येणार नाही’.

अर्थात प्रश्न येथे संपत नाही. साहित्य अभ्यासकांनी या दाव्याला दुजोरा न देण्याची कारणमीमांसा अनेक ठिकाणी केली आहे. यामध्ये हस्तलिखित कवितासंग्रहातल्या इतर त्रुटी, या कवितेतली शब्दयोजना, यमक योजना, कवितेतली विचार मांडण्याची पद्धत इत्यादी बाबतीत सखोल चर्चा आणि चर्विचरण समाविष्ट आहेत.

शेक्सपिअर हा जागतिक पातळीवर नावाजलेला एक बडा साहित्यिक. इतक्या शतकानंतरही त्याच्या कलाविष्कारातली जादू आस्वादकांच्या दृष्टीने भुरळ पडणारी आहे यात शंकाच नाही. त्यामुळे कुठलाही नवीन दावा पुरेशा खंडन-मंडन प्रक्रियेतून तावून सुलाखून निघाल्याशिवाय मान्य होणार नाही हे साहजिकच. या चर्चेत गणित/सांख्यिकी तज्ञांनीही भाग घेतला हे विशेष!

-मेघना
सदर लेख माझ्या ब्लॉगवरही प्रसिद्ध केला आहे.

अधिक वाचनासाठी:
https://en.wikisource.org/wiki/Shall_I_die%3F
https://www.researchgate.net/publication/30962620_Did_Shakespeare_Write_...
http://www.stat.uchicago.edu/~pmcc/reports/efron.pdf
https://apnews.com/article/fd57ca22c351c9707f7d0339adbfa2e6
https://www.nytimes.com/1985/12/06/arts/critics-say-newly-found-poem-isn...

Group content visibility: 
Public - accessible to all site users

अत्यंत रोचक, मस्तच लेख मेघना !! Happy

छान

पण शेवट सबळ पुराव्या अभावी बाइज्जत बरी सारखे वाटले

रोचक माहिती. कवितांचे विश्लेषण संख्याशास्त्र व गणित वापरून करणे हे प्रथमदर्शनी विचित्र वाटते पण "नैसर्गिक पॅटर्न" ह्या पातळीवर विचार करता ते कुठेतरी मनाला पटते. आजच्या काळात मशीन लर्निंगचा वापर करून सुद्धा हे करता येईल. ठोस माहित असलेल्या उपलब्ध साहित्याच्या आधारे आधी पॅटर्नचा अल्गोरिदम बनवायचा. मग प्रश्नांकित असलेली साहित्यकृती या अल्गोरिदम ला दिली कि ती त्या पॅटर्न मध्ये कितपत बसते त्याचा स्कोअर तो देईल. असे काहीसे. पण यात सुद्धा किती स्कोअर आला कि त्याला "ठोस" समजायचे हे मात्र आपल्यालाच (मनुष्याला) ठरवावे लागते, अशी मेख आहे. अर्थत यादृष्टीने प्रयत्न ऑलरेडी तिकडे सुरु असतीलच.

छान लेख.
मॉडेलिंग वरुन सपोर्टिंग पुरावा शोधणे इंटरेस्टिंग आहे.

मस्त लेख! मी रिसर्च मेथड्स नावाच्या एका फ्रेशमन कोर्स साठी टिचिंग असिस्टंट म्हणून काम करत होते तेव्हा मुलांना पहिला प्रकल्प observational research वर आधारित करायला सांगायचो. त्यावेळी एका मुलीने असा एक प्रकल्प केला होता - तिने काही पुस्तके जुनी 1950 पूर्वीची आणि काही गेल्या दहा वर्षांत प्रसिद्ध झालेली अशी घेऊन त्यांची शब्दसंख्या, एका परिच्छेदात किती शब्द, किती अक्षरांचा एक शब्द यावरून शब्दांची लांबी असा तुलनात्मक अभ्यास केला होता. यासाठी तिने प्रत्येक पुस्तकातून काही उतारे घेतले होते. तिने असे गृहितक मांडले होते की जुन्या पुस्तकांचे वाचनमूल्य अधिक असते कारण त्यातल्या भाषेची characteristics वेगळी असतात. They are more complex than the contemporary books. त्याची आठवण झाली लेख वाचताना!

छान लेख !
ही काही उदाहरणे आपण पुढेमागे कधीतरी पाहूच >> कृपया हे लेखन ही मनावर घ्या..

सर्व प्रतिसादकर्त्यांचे आभार Happy

@अस्मिता, अभिप्राय कळवल्याबद्दल थॅंक यू!

@BLACKCAT - सबळ पुराव्या अभावी बाइज्जत बरी >> हाहा खरंच की!

@अतुल. - हो तुमचा विचार अगदी योग्य आहे. पॅटर्न रेकाग्निशन साठी मशीन लर्निंग अगदी उपयोगी ठरतंय. या प्रकारच्या विश्लेषणाला स्टायलोमेट्री म्हणतात. फोरेन्सिकमध्ये खूप वापर होतो.

@अमितव - हो खरंच interesting आहे

@प्रभुदेसाई - Lol कल्पना मस्त आहे. वेमा डेटा देणार असतील तर करू की! Wink पण मुरलेल्या मायबोलीकरांना डू आयडी शोधण्यासाठी मॉडेलिंग करायची गरज पडत नाही Happy
"गोल्ड बग" गोष्ट माहीत नव्हती, आता बघते लिंक. धन्यवाद.

@जिज्ञासा - छान प्रोजेक्ट. मजा आली असेल! जुनी भाषा जास्त कॉम्प्लेक्स आणि आताची नाही हे मी म्हणणार नाही. माझ्या मते complexity वेगळ्या प्रकारची असू शकेल. पण याबद्दल जास्त बोलण्याइतका माझ्या अभ्यास नाही.

@ सीमंतिनी - मॅन हंट पाहिली नाही, बघेन नक्की!

@चिन्मय_1 - नक्की आवडेल.

छान लेख.
मॉडेलिंग वरुन सपोर्टिंग पुरावा शोधणे इंटरेस्टिंग आहे.
>> +१

लिहित रहा.