डेटा मायनिंग म्हणजे काय?

Submitted by जागोमोहनप्यारे on 5 July, 2011 - 03:06

डेटा मायनिंग म्हणजे काय?

घरबसल्या ऑन लाईन डेटा मायनिंगचे काम करा अशा जाहिराती दिसतात. हे नेमके कसले काम असते?

Group content visibility: 
Public - accessible to all site users

बहुतेक कंपन्या साउथच्याच दिसतात. मुम्बई बेस कंपनी क्वचितच. का हा असा अन्याय आमच्या मुंबईवर? Proud

विकिवरची माहिती चांगली आहे. पण प्रत्यक्षात असे काम करनारे कुणी आहेत का? त्यंचा अनुभव काय आहे? अशा कंपन्या २००० च्या आसपास फी घेतात आणि म्ग ते लिंक देताअत. त्यानंतर काअम करायचे. असा प्रत्यक्ष अनुभव असणाराअ कुणी आहे का?

अशा कंपन्या २००० च्या आसपास फी घेतात आणि म्ग ते लिंक देताअत. >> अशा कंपन्या फसवणुक करता आहेत. डेटा मायनिंग हा Business intelligence चा एक भाग आहे. अशा जाहीरातींना बळी पडू नका. जर काम द्यायच आहे तर पैसे कसले घेतात? पैसे घेउन काम देणारे सगळे चोर आहेत.

निट चौकशी करा हल्ली असे फसवणुकीचे बरेच किस्से आहेत. Speak asia हे लेटेस्ट आहे. बरेच आयटी मध्ये असणारे लोक देखिल फसले आणि इतरांनाही फसवलं.

ते पैसे फक्त लिंक प्रोवाइअड करायचे घेतात. नंतर आपल्याला जी असाइन्मेम्ट मिळते ती आपणच करावी लागते. त्याचे पैसेही त्या असाइन मेम्ट देणाअर्‍या कंपनया देतात म्हणे. अशा कंपन्या ऑफलाइन डेता प्रोसेसिंगचेही काम करतात. उदा. पुस्त्काची हाताने लिहिलेल्या स्कॅन कॉपी वरुन टाइप कॉपी तयाअर करणे. इ. आता हे काम तर जेन्युनच आहे. पी डी एफ फाइलपासुन डोक. फाऐल तयारकराणे. इ. अनेस प्रकाअर असतात. त्यात डेटा मायनिंगदेखील असते. कोणत्याही एका प्रकाराला दीड ते दोन हजार फी घेतात.

पुस्तकाचे स्कॅन--> टाइप करणे महत्वाचे काम असल्याने ते फी डिपोझिट स्वरुपात घेतात.काही कंपन्या एक वर्शाने पूर्ण काम यशस्वी केल्यास परतही देतात. कंपनी टु कंपनी नियम बदलतत.

काही कंपन्या यालाच ऑनलाइन डेटा प्रोसेसिंग असे म्हणतात. यात फसवणुकीचे प्रकार असतीलही तर तेही उघड व्हायला हवेत.

विकिवरची माहिती चांगली आहे. पण प्रत्यक्षात असे काम करनारे कुणी आहेत का? त्यंचा अनुभव काय आहे?
आयला, मला वाटले भारतीयच काँप्युटरमधे हुष्षार! त्यांना सगळे काही येते!!
असो. अमेरिकेत या. इथे अनेक ठिकाणी हे काम करतात. बरीच वर्षे करताहेत! त्यातहि भारतीयच असतील. कारण एकदा काय नि कसे करायचे हे ठरवून दिल्यावर रोजच तेच तेच काम करायला स्वस्त लोक बरे पडतात!!
म्हणजे मग दुसरे काहीतरी शोधून काढायला वेळ मिळतो अमेरिकनांना. तेच असे काम करत बसले असते तर त्यांना कसे जमले असते, नवीन नवीन शोध लावणे??

Proud

सतत शोध लावण्याचे काम देखील तेच तेच करने न्हवे का? शेवटी इथुन तिथुन सगलेजण तेच तेच काम करत असतात.... Proud

डेटा मायनींग आणि प्रोसेसींग अगदी वेगळ्या गोष्टी आहेत.

आम्हाला सततच मायनींग करावे लगते (नेहमीच्याच कामाकरता) . needles in haystack सारखा तो प्रकार असतो.
पण ते करण्याकरता अनेकदा चांगले प्रोग्राम्स लागतात, व सुरुवातीला बराच वेळ सुद्धा लागु शकतो - आणि खरच भरपुर डेटा असेल तर चांगला संगणक पण.

कंपनीमध्य सुरु असनार्‍या डेटा मायनिंगबद्दल नाही, सिंपल होम बेस्ड छोटे प्रोजेक्ट, जे ३०-४० मिनिटात करता येतात, अशाबाबत हा बिजनेस आहे.

वरची साइट बहुतेक भारतात रहानार्‍या भारतीयांसाठी असावी असे वातते.. बाकीच्यानी Light 1 घ्यावा

हे खुप मोठे क्शेत्र आहे. विकीवर सविस्तर आहेच. डेटा मायनिंग बद्दल थोडक्यात (साध्या शब्दात) सांगायचा प्रयत्न करतो,
मायनिंग म्हणजे उत्खनन. उदा. कोल मायनिंग मधे जमिनीचे उत्खनन करत कोळसा मिळतो का याचा शोध घेतला जातो. याच प्रमाणे प्रचंड प्रमाणात असलेल्या डेटा (माहिती) मधुन काही निष्कर्ष काढायचा प्रयत्न केला जातो जेणे करुन कंपनीला त्याचा उपयोग फायदा वाढवण्यासाठी किवा तोटा कमी करण्यासाठी करता येईल. यासाठी मागील काही वर्षाचा डेटाची उलथापालथ करुन त्यातुन काही पॅटर्न, ट्रेंड आहे का हे शोधले जाते. त्याआधारे एखादे मॉडेल बनवुन कंपनी काही योजना आखु शकते.
उदा. एखाद्या कपड्याच्या ऑनलाईन स्टोअर वरुन लोक अनेक कपडे बघतात आणि काही जण घेतातही. इंटरनेट युजरने केलेले प्रत्येक क्लिक आणि त्यासंबंधीची माहिती गोळा केली जाते आणि त्याआधारे काही विशिष्ट पॅटर्न आहे ते शोधले जाते. एखादा शर्ट घेताना पहिल्यांदा फ्री शिपिंग बॅनर वर क्लिक केले त्यावेळी बाजुला असलेल्या वुमन न्यु अरायव्हल वर क्लिक केले त्या नंतर त्याच्या बाजुला दाखवलेल्या मेन जॅकेट वर क्लिक केले आणि मग त्यासोबत दाखवलेल्या शर्ट वर क्लिक करुन तो घेतला गेला. हा जर पॅटर्न लक्षात आला तर कंपनीला वेब कंटेट कसे टाकता येतील याचा अंदाज येतो आणि त्याप्रमाणे बदल करुन ग्राहकांना जास्तीत जास्त आकर्षित करायचा प्रयत्न केला जातो. त्याच प्रमाणे जर लोक प्रॉडक्ट शॉपिंग कार्ट मधे टाकत असतील आणि नंतर न घेता निघुन जात असतील तर त्याची कारणे शोधण्यात येते.
अ‍ॅमेझॉन / नेटफ्लिक्स हे लोक तुम्ही काय घेता त्याची माहीती ठेवतात त्याच प्रमाणे तुम्ही घेतात त्याच वस्तु इतर कोण घेतात त्याच्यांशी तुलना करुन तुम्हाला हे पण आवडेल असे सुचवले जाते. हे मॉडेलिंग पण डेटा मायनिंगचाच भाग आहे.
तुम्ही क्रेडीट कार्डसाठी विचारणा करतात. क्रेडिट कार्ड कंपनी तुमच्या मागील मिळकतीचा आणि खर्चाचा माहितीचा अभ्यास करुन किती रिस्क आहे हे ठरवतात. त्याप्रमाणे तुम्हाला कार्ड द्यायचे का नाही आणि दिले तर किती लिमिट हे ठरवले जाते. हे रिस्क मॉडेल पण डेटा मायनिंग प्रकारात येतो.
वर सांगितल्याप्रमाणे ह्या साठी प्रचंड प्रमाणात डेटा लागतो तसेच काही विशिष्ठ संगणकप्रणालींची गरज असते. सर्वात महत्वाचे म्हणजे गणित/ सांख्यिकी ह्या क्षेत्रात प्राविण्य पाहिजे.
हे काम ३०-४० मिनिटात कधीच शक्य नाही. बर्‍याच वेळा खुप उत्खनन करुन पण काही विशेष हाती लागत नाही. २-३ महिने वाया जातात पण काही नाही हे माहिती होण्यासाठी तरी मेहनत करावीच लागते.
वर दिलेल्या लिंकवर जॉबची माहिती वाचली. त्याप्रमाणे ते लोक कीवर्ड आणि लोकेशन देणार आणि तुम्ही इंटरनेट वरुन माहिती गोळाकरुन त्यांना द्यायची. एकाप्रकारे माहिती हुडकुन काढणे आहे म्हणुन डेटा मायनिंग म्हणत असतील पण खरेतर हे डेटा कलेक्शन झाले. ह्यासाठी गणित ह्या विषयाचा संबंध नसलातरी चालतो.

महागुरु, थोडक्यात पण चांगली माहिती करुन दिलीत.
यावरुन, डेटा वेअर हाऊसींग- डेटा माय्निंग व डेटा मार्ट यावर इंजिनियरींगला असताना प्रेझेण्टेशन केलेले आठवले.

जर बाजारात एखादा रेडिमेड प्रोग्रॅम असेल, ज्यात थोडे बदल करून काही ठराविक, मर्यादित उपयोगासाठी, वापरता येईल, असा प्रोग्रॅम विकत घेऊन ३०-४० मिनिटात डेटा मायनिंग (निदान जामोप्या यांना जो अर्थ अभिप्रेत आहे, असे वाटते, त्या अर्थाने) करता येईल.

एक भल्या मोठ्या जागतिक कंपनीचा भला मोठ्या प्रमाणावर असलेला डेटा, अक्षरशः डझनावारी निरनिराळ्या सिस्टिम्स मधून गोळा करून दररोज त्यातून माहिती संकलित करण्याची व त्यातून वर उल्लेखिलेले काम करणारी सिस्टीम १५ का १६ वर्षांपूर्वी माझ्या प्रोजेक्टमधे मी तयार केली होती - माझ्या खेरीज कुणीहि भारतीय माणूस त्यात नव्हता. कल्पना, डिझाईन, रिक्वायरमेन्ट्स माझ्या, हमाली दुसर्‍यांची.

त्या काळी त्याला डेटा मायनिंग म्हणत नसत. त्यामुळे आजकालच्या मुलांना वाटेल, छे: ते काही डेटा मायनिंग नव्हे. जसे काही लोक म्हणतात, कोबॉल प्रोग्रॅम म्हणजे खरा प्रोग्रॅम नव्हे, जावा खरे. किंवा तुम्ही कॅलक्युलेटर न वापरता करता ते गणित नव्हे, स्पेलचेक न वापरता लिहीले तर ते बरोबर नसणारच!!

कारण काय करायचे नि कसे करायचे या दोन वेगळ्या गोष्टी आहेत, काय करायचे यात फार थोडा फरक असतो, कसे करायचे ते आजकाल दर आठवड्याला बदलू शकते, एव्हढ्या वेगाने प्रगति चालू आहे.

माझ्या मते, नुसती फॅन्सी नावे वापरण्यापेक्षा काय करायचे ते जर धंद्याच्या भाषेत सांगितले तर अगदी माझ्यासारखे लोक सुद्धा कसे करायचे ते सांगू शकतील. आणि बाकीचे सगळे माझ्यापेक्षा कितीतरी जास्त हुषार नि माहितगार आहेत. त्यातून मी अनेSक वर्षांपूर्वी निवृत्त झाल्याने, नवीन गोष्टी जसे जावा, नणंदा, नवीन नवीन system development 'methodology', लिनक्स, क्लॉउड काँप्युटिंग, फेसबूक, स्काईप हे फक्त शब्द मला माहित आहेत. त्यांच्या किंमतीच्या मानाने त्या कितपत उपयोगी असतील याची जरा शंकाच आहे. असत्या तर भारतीयांसारख्या हुषार लोकांनी पूर्वीच त्या शोधून काढल्या असत्या.

जामोने दिलेल्या साईट वरिल डेटा मायनींगची डेफिनेशन पण करेक्ट आहे Happy आपण जे डेटा मायनींग ते पण हेच आहे पाण हे गुगल वर सर्च मारुन इमेल आयडी चा डेडा शोधुन काढायचा.

DATA MINING :

We Will Provide Help by Mail on Your E-mail ID . Candidate's Working keyword and Location will be mentioned in the Mail. You can start your work with that keyword and Location and for starting your Work you can open any Internet Searching Site , Job Portals , Online Directory , yellow Pages for searching the data. You can enter keyword and Location there on the Site and search the company's Contact Details. When you search many company listings comes there ,Candidate can open each and every company Listings or website, You can copy data from there and Paste into Excel sheets. Give below all Details of company Listings. i.e. - Company Name , Address(if Possible) , City , State ,E-mail id , Website, Mobile Number , Phone Number.

लिड जनरेशनचा जॉब आहे.
Upto 60,000 Leads in a month – Rs 2500 Per 1000, असे लिड ही कंपनी ५०पैसे ते १रु ला एक लिड ह्या भावाने विकते. त्यामुळे ६० हजार लिड साठी १५००० देणे हा चांगला बिसनेस आहे. पण ८०० रु जरा जास्त फी आहे तरीही ठिक आहे.
येवढीच रिस्क आहे की तुम्ही जे काही काम करता आहात ते सायबर क्राईमच्या दुष्टीकोनातुन कायदेशीर आहे किंवा नाही हे चेक करणे.

येवढीच रिस्क आहे की तुम्ही जे काही काम करता आहात ते सायबर क्राईमच्या दुष्टीकोनातुन कायदेशीर आहे किंवा नाही हे चेक करणे.
अत्यंत महत्वाचे! Identity theft हा प्रकार वारंवार वाचनात येतो.
जी कंपनी तुम्हाला काम देते, त्यांच्याकडे बरेच वकील असतील जे या कायद्यात पारंगत आहेत नि कंपनीला सोडवतील. तुम्हालाच तुमची काळजी घ्यावी लागेल.
हा कायद्याचा मुद्दा सोडला तरी - समजा तुम्ही तुमच्या माहितीतल्या लोकांची नावे, माहिती 'लीड' म्हणून दिलीत नि कंपनीने त्याचा उपयोग Identity theft करण्यासाठी वापरला, किंवा एकाएकी निरनिराळे सेल्समन निरनिराळ्या गोष्टी विकण्यासाठी त्यांना त्रास देऊ लागले तर लोक अ‍ॅम्वे च्या सेल्समनला टाळतात तसे तुम्हाला टाळतील. कुणि लग्नाला, चहाला बोलवणार नाहीत, कुणि तुमच्याकडे येणार नाहीत, तुम्ही दिसला की पाठ फिरवून रस्ता बदलतील!! आणि एकटे तुम्हालाच नाही, तुमची बायको, मुले, भाऊ, बहिण, आई, वडील, नातेवाइक सगळ्यांची हीच अवस्था होईल!!

झटपट पैसे मिळवणे एव्हढे सोपे नाही!

विकिवरची माहिती चांगली आहे. पण प्रत्यक्षात असे काम करनारे कुणी आहेत का? त्यंचा अनुभव काय आहे? >>>> हे पण येऊ द्यात .......

हे पण येऊ द्यात ....... >> मग मी काय लिहले आहे? सविस्तर माहिती लिहायची म्हणजे एक प्रबंध तयार होईल.

जामोप्या, http://www.netjobs4all.com/ ही लिंक पहा. तुम्ही दिलेल्या लिंकवरील मजकूर जसाच्या तसा ईथेही दिसतोय. पैसे मिळवणं ईतकं सोपं असेल कां याचा विचार करा.

. पण प्रत्यक्षात असे काम करनारे कुणी आहेत का? त्यंचा अनुभव काय आहे?
भारतात कोण काय करतात माहित नाही पण गूगलवर अमेरिकेतल्या चार पाच कंपन्यांची नावे सहज सापडतील. त्यांच्याशी संपर्क साधा. तिथेहि काम करणारे बरेचसे भारतीयच असतील, त्यातले कुणितरी तुमच्या ओळखीचे निघतीलच, किंवा तुमच्याच कॉलेजातले असू शकतील, ते नक्कीच अधिक माहिती देऊ शकतील. त्या अमेरिकन कंपन्यांकडे नुसता नोकरी साठी अर्ज केलात तरी ते खूप माहिती सांगतील,

Pages