HindiTech

New Era of Information

what is machine learning in Hindi beginners guide

Machine Learning इस शब्द को आपने कई बार सुना होगा और आपके दिमाग़ में कभी ना कभी तो यह ख्याल भी जरूर आया होगा की आखिर यह Machine Learning है क्या?

अगर आप इसी प्रश्न का जवाब जानने आए है तो मैं आपको बता दू की आप बिलकुल सही जगह पर आए है। 

आज के इस Machine Learning in Hindi – Basic Guide आर्टिकल में आपके Machine Learning को लेके सारे प्रश्न, सारे संदेह दूर हो जाएँगे। 

और मैं एक और बात का दावा कर सकता हूँ की यह आर्टिकल पढ़ लेने के बाद आपको Machine Learning का अच्छा-खासा ज्ञान हो जायगा।

यह आर्टिकल किसके लिए है ?

अगर आप student है, आपको यह Machine Learning विषय पढ़ना है या आप एक ऐसे व्यक्ति है जिसे नई-नई चीजों को जानना और समझना पसंद है। तो यह आर्टिकल आपके लिए है।  

इस आर्टिकल को मैंने कुछ इस तरह लिखा है। जिससे इस आर्टिकल को हर कोई पढ़ सकता है यानि अगर आपको Machine Learning के विषय में कुछ भी नहीं पता या थोड़ा बहुत ज्ञान रखते है। 

तो आज आप इस Machine Learning in Hindi के माध्यम से Machine Learning के बारे में संपूर्ण ज्ञान प्राप्त कर लेंगे। 

मैं पेशे से एक छात्र हूँ। और पिछले कुछ समय से Machine Learning, Python, Data Science जैसे क्षेत्रों में निरंतर अभ्यास कर रहा हूँ।

और मैंने अभी तब इस क्षेत्र में जो कुछ भी पढ़ा या सीखा है।

आज इस Machine Learning in Hindi आर्टिकल के माध्यम से आप सब से साझा करने जा रह हूँ। 

What is machine learning in Hindi

what is machine learning in Hindi it is a beginners guide

Machine learning एक application है जिसमे मशीन/कंप्यूटर अपने ही प्रोग्राम से अपने आप सीखती है और हमें output देती है। Machine Learning को AI का subset भी कहा जाता है। 

Definition of Machine Learning 

“Machine learning कंप्यूटर साइंस का एक part होने के साथ-साथ Artificial Intelligence का subset है। जहाँ हम data को computer program /algorithm में feed करते है और computer program अपने आप उस दिए गए data में patterns या data points को कुछ Mathematical functions की मदद से समझ लेता है और हमे output या prediction प्रदान करता है और इसी प्रक्रिया को Machine Learning कहते है।”

आसान शब्दों में हम Machine को Data दे रहे है और Machine उस Data से अपने आप सीख रही है और यही समानता हमें इसके नाम में भी देखने को मिलती है – ‘Machine Learning’।

और यह समय के साथ – साथ एक हद तक अपने आपको और बेहतर करती जाती है। 

Why Machine Learning

why we should use machine learning

अब Machine Learning ही क्यों ? मान लीजिये की आप Machine Learning का उपयोग किए बिना। 

Traditional programming में filter program लिखना चाहते हैं। जैसे ‘Spam Emails को filter करना। ‘ 

अब यहाँ पर आपको कुछ बातों का ध्यान रखना होगा जैसे :-

– शुरुआत में, आप देखेंगे कि Spam Emails कैसे दिखते है ?

– आप उन words या sentences का चयन कर सकते हैं जिनका spammers उपयोग करते हैं, जैसे “debit card,” “free,” और इसी तरह के कई शब्द । 

– अब आपने जो पैटर्न देखे हैं, उनका पता लगाने के लिए आप एक algorithm/program लिखेंगे। 

– और फिर आपका program Email को  spam के रूप में प्रदर्शित करेगा यदि spam पैटर्नों की एक निश्चित संख्या का पता चले, जो की आप algorithm में बता चुके हो ।

– अब आप प्रोग्राम का परीक्षण करेंगे, और पहले दो steps को फिर से दोहराते रहेंगे जब तक कि परिणाम पर्याप्त न हों।

इसमें नियमों की एक बहुत लंबी सूची है जिसे बनाए रखना मुश्किल है। traditional programming से ऐसा प्रोग्राम बनाने में बहुत समय लगता है और साथ ही उसकी accuracy का भी कोई अता-पता नहीं होता। 

जैसे : आपने अपने प्रोग्राम में एक शब्द दिया ‘for you’ और अपने प्रोग्राम को कहा की जिस भी email में तुम्हे ऐसा शब्द दिखे या मिले तो उस email को spam email घोषित कर देना।

अब अगर spammers ‘for you’ शब्द की जगह ‘4U’ का इस्तेमाल करने लग गए। तो यहाँ आपका प्रोग्राम असमर्थ हो जाएगा और spam detection में error देने लगेगा। 

Traditional techniques का उपयोग करने वाले program को update करने की आवश्यकता होगी,

जिसका अर्थ है कि, यदि कोई अन्य परिवर्तन होते है , तो आपको बार-बार अपना code update करना होगा।

और दूसरी तरफ एक प्रोग्राम जो ML Techniques  का उपयोग करता है, वह अपने आप से spammer द्वारा हर परिवर्तन का पता लगा लेगा,

और यह आपके द्वारा manual रूप से बताए बिना उन्हें (emails को ) spam email घोषित करना शुरू कर देता है।

When should you use ML

when should anyone can use the machine learning

Machine learning का इस्तेमाल कब और कहाँ करे ?

जब आपके पास कोई ऐसी समस्या आती है जिसके समाधान के लिए आपको नियमों की कई लंबी सूचियों की आवश्यकता होती है।

तो इस मामले में Machine Learning तकनीक आपके code को सरल बना सकती है और performance में सुधार कर सकती है।

बहुत ही Complex problems जिनको  traditional programming से solve करना मुश्किल हो।

जहा गैर-स्थिर वातावरण हो वहा Machine Learning सॉफ़्टवेयर नए data के अनुकूल हो सकता है। 

History of Machine Learning

history of machine learning in Hindi

Neural Network का पहला मामला 1943 में आया था, जब न्यूरो फिजियोलॉजिस्ट वॉरेन मैकलोच (Warren McCulloch) और गणितज्ञ वाल्टर पिट्स (Walter Pitts) ने neurons के बारे में एक पेपर लिखा था, यानी Neurons कैसे काम करते हैं।

उन्होंने एक electrical circuit का उपयोग करके इसका एक मॉडल बनाने का फैसला किया, और यहाँ neural network का जन्म हुआ।

1950 में, एलन ट्यूरिंग (Alan Turing) ने विश्व प्रसिद्ध Turing test बनाया। यह परीक्षा काफी सरल है – एक कंप्यूटर को पास होने के लिए, उसे एक इंसान को यह समझाने में सक्षम होना चाहिए कि वह एक इंसान है, कंप्यूटर नहीं।

1952 में पहला कंप्यूटर प्रोग्राम देखा गया जो चलने के दौरान सीख सकता था। यह एक ऐसा खेल था जिसमें आर्थर सैमुअल (Arthur Samuel) द्वारा बनाए गए चेकर्स (एक प्रकार का खेल) खेले जाते थे।

और यही जन्म हुआ Machine learning का, आर्थर सैमुअल (Arthur Samuel) पहली बार 1952 में “मशीन लर्निंग” वाक्यांश के साथ आए थे।

फ्रैंक रोसेनब्लैट (Frank Rosenblatt) ने 1958 में पहला artificial neural network डिजाइन किया, जिसे परसेप्ट्रॉन (perceptron) कहा जाता है। इसका मुख्य लक्ष्य patterns और shapes की पहचान करना था।

कई जगह पर यह भी कहा गया है की “Machine Learning” शब्द 1959 में आर्थर सैमुअल (Arthur Samuel) द्वारा गढ़ा गया था। 

इसी तरह Machine Learning, Artificial Intelligence और Deep learning के क्षेत्र में कई आविष्कार और प्रयोग हुए। 

इन्हीं सब की बदौलत आज हमें एक ऐसी technology मिली जिसने हमारे अधिकतर कामों को आसान कर दिया है। और इसलिए हम जिस युग में जी रहे है उसे “information era” भी कहा जाता है। 

neural networks, perceptron’s, pattern recognition, shape recognition और कई इन सब topics के बारे में हम Artificial Intelligence और Deep Learning क्षेत्र में ज़्यादा अच्छे से पढ़ते है। 

तो यह था Machine Learning से जुड़ा इतिहास। 

Prerequisite for Machine Learning

Mathematics required for understanding the machine learning

जैसे की हमने Machine Learning की परिभाषा में देखा कि हम Machine को data provide कराते है और फिर Machine उस data में Mathematical function की मदद से pattern या data point find करती है।

जिससे Machine हमे output या prediction दे सके। 

यानि जो ML model है उसके पीछे Math’s काम कर रही है। Math’s की मदद से हम Data से output निकाल पा रहे है। 

Machine Learning को सीखने या समझने के लिए हमे उसी Math’s की आवश्यकता होती है। यह भी अपने आप में एक बहुत बड़ा topic है , पर मैं आपको इसे संक्षिप्त रूप से समझने की कोशिश करूँगा। 

Mathematics for ML

अब math’s शब्द आते ही कुछ लोग बहुत डर जाते है और math’s के नाम से दूर भागते है। 

तो मैं आपको बता दू की यहाँ पे आपको math’s की समझ होनी चाहिए। ना की आपको math’s के बड़े-बड़े प्रश्नों को हल करना है।

आपको बस इतना पता होना चाहिए की जो दिया गया सवाल है या दी गयी math’s equation है वह कैसे काम करती है या कैसे solve होती है।

Linear Algebra 

linear algebra for machine learning

Linear algebra गणित की शाखा है Linear algebra गणित के लगभग सभी क्षेत्रों का केंद्र है।

जिसमें linear equation, matrices, determinants, vector spaces और linear transformations के सिस्टम का सिद्धांत शामिल है। ML में Linear algebra का प्रयोग किया जाता है।

Linear equation यानी दो variables के बीच एक equation जो graph पर plot होने  पर एक सीधी रेखा दे।

Matrix

matrix for machine learning

जब कुछ संख्याओं को rows और columns में व्यवस्थित किया जाता है और दोनों तरफ square brackets [] से घिरा होता है, तो हम इसे एक Matrix कहते हैं। Machine learning में मैट्रिक्स  के बहुत महत्वपूर्ण उपयोग हैं।

Vector Calculus

vector calculus for machine learning in hindi

जिसे vector analysis के रूप में भी जाना जाता है, विशेष रूप से यह three-dimensional Euclidean space में vector field के differentiation और integration से संबंधित है। vector field space के subset में प्रत्येक बिंदु पर एक Vector के वितरण का प्रतिनिधित्व करते हैं।

Statistics and Probability

Statistic and Probability for machine learning in Hindi

Statistics गणित की एक शाखा है जो संख्यात्मक डेटा के collection, analysis, interpretation और presentation से संबंधित है। 

Probability का अर्थ है संभावना। यह गणित की एक शाखा है जो random event से संबंधित है। घटनाओं के घटित होने की संभावना का अनुमान लगाने के लिए गणित में Probability का परिचय दिया गया है।

जब भी हम data की बात करते है तो वहां Statistics और Probability का विशेष महत्व होता है।

जब हम data से output या analysis निकालते है तो वहां पर Statistics काम आता है और जब data से prediction करना होता है तो वहां हम Probability की सहायता लेते है। 

Analytic Geometry

analytical geometry for machine learning in Hindi

Analytical geometry, जिसे coordinate geometry भी कहा जाता है, यह गणितीय विषय है जिसमें algebra symbolism और methods का उपयोग geometry में समस्याओं को represent करने और हल करने के लिए किया जाता है।

Analytic geometry का महत्व यह है कि यह geometric curves और algebraic equations के बीच एक correspondence स्थापित करता है।

Traditional programming vs Machine Learning

Traditional programming vs Machine Learning programming in Hindi

जैसे हम पहले भी बात कर चुके है की अगर आप Traditional programming की मद्दत से spam email filter जैसे program बनाते है ।

तो वहां पर आपको बहुत सारी manual चीज़ो का ध्यान रखना होता है। और समय- समय पर अपने program को manually update भी करना होता है।

और उस program की accuracy भी खास नहीं होती। 

और वही अगर आप इसी प्रोग्राम को Machine Learning की मदद से बनाते है तो यह काफी आसान और अच्छी accuracy से बनता है और आपको इसे manually update करने की जरूरत भी नहीं होती।

Traditional programming

Traditional programming  को हम ऐसे समझ सकते है की पहले आपको यहां कुछ rules defined करने होते है और फिर उसके बाद आपका program या machine उस rules के according आपको output और prediction देती है।

Machine Learning

और वही ML में आप machine को data देते हो और machine कुछ math’s की मदद से अपने आप उस data पर  rules define करती है फिर आपको output और prediction देती है। 

Traditional programming और Machine Learning programming दोनों का अपना महत्व है। यह समस्या पर निर्भर करता है की आप उस समस्या का हल Traditional programming से निकलना चाहते है या  Machine Learning programming से।

AI vs ML vs DL

AI vs ML vs DL in Hindi

हमने ML की परिभाषा में भी देखा था की Machine learning AI का subset है।

और जैसा की आप दी गयी image में देख सकते है की Artificial intelligence एक broad area है।

इसका subset Machine Learning है और machine learning का subset Deep learning है।

यानि आपको AI में काम करने से पहले ML और DL का अच्छा knowledge होना चाहिए।

Image को देख कर आपको लग रहा होगा की इस हिसाब से तो पहले हमे Deep Learning पढ़नी चाहिए।

पर ऐसा बिलकुल भी नहीं है Deep learning के लिए भी पहले आपको Machine Learning अच्छे से सीखनी होगी।

ML सबसे पहले सीखनी जरूरी इसलिए है क्योंकि जब तक आप ML algorithms को समझेंगे नहीं, देखेंगे नहीं तब तक आप DL और AI की algorithms पर काम नहीं कर पाएँगे। 

ML algorithms को हम DL और AI की algorithms का base या foundation बोल सकते है। 

और जब तक foundation strong नहीं होगा तब तक आप आगे काम नहीं कर पाएँगे। 

हमने यह तो देख लिया की AI vs ML vs DL में सबसे पहले क्या सीखना चाहिए। और कौन किसका subset है। अब इनकी definition से उनके actual work को जानते है।

Artificial Intelligence

AI का मतलब artificial intelligence है और हम कह सकते हैं कि इसमें हम मशीन को कुछ intelligence देते हैं ताकि मशीन इंसान की तरह नकल कर सके या इंसान की तरह काम कर सके।

अधिकांश AI system pattern recognition पर आधारित हैं। 

पहली AI system जिसे symbolic AI के रूप में जाना जाता था और उसके बाद हमें Expert AI मिला था । 

Symbolic AI के लिए पहले उन्होंने (वैज्ञानिको) if/else conditions का उपयोग करके एक knowledge base बनाया फिर उस knowledge base की मद्दत से Symbolic AI का निर्माण किया। 

और Expert AI system के लिए उन्होंने (वैज्ञानिको) पहले विशेषज्ञ से कुछ knowledge प्राप्त किया और उस knowledge की मदद से एक  knowledge base तैयार किया और फिर उस knowledge base को code में परिवर्तित कर दिया।

Machine Learning 

ML के बारे में तो आप जानते है यह कंप्यूटर साइंस का एक हिस्सा है और साथ ही Artificial Intelligence का एक subset है।

जहां हम डेटा में पैटर्न खोजने के लिए mathematical approach का उपयोग करते हैं।

हम कह सकते हैं कि डेटा में पैटर्न को खोजने की तकनीक को Machine Learning  के रूप में जाना जाता है।

Deep Learning

Deep Learning मानव जीव विज्ञान से प्रेरित है जैसे मानव मस्तिष्क में कुछ neurons होते हैं जो हमें कुछ actions करने में मदद करते है और ठीक वैसे ही Deep Learning में perceptron’s होते है। 

यह perceptron’s मानव neuron के  आधार पर बना होता है, Deep Learning  में हम बड़े पैमाने पर काम करते हैं।

और इसमें हम perceptron’s की सहायता से neural networks की संरचना करते है। 

What is Training and Testing in ML

What is Training and Testing in ML in Hindi

जब भी हम machine Learning का प्रोग्राम लिखते है तो उसे ML Model कहा जाता है।

ML Model में algorithm के साथ data भी मौजूद होता है जिसकी मद्दत से model predict कर पाता है। और इसमें इस्तेमाल होने वाले data को हम दो भागों में बाटते है।

एक भाग को हम training data कहते है जो model training के वक्त काम में आता है और दूसरे भाग को हम testing data कहते है। जब model बनकर तैयार हो जाता है तो उस model को test करने के लिए testing data काम में आता है।  

Training and testing में data को divide क्यू करना ? क्या हम पूरे data का इस्तेमाल नहीं कर सकते ML Model बनाते वक्त ?

आप पुरे data का इस्तेमाल कर सकते है ML Model बनाते वक्त। पर ऐसा करने से आप ये कभी नहीं जान पाएंगे की आपका Model कितना accurate है, कितना अच्छे से काम कर रहा है  या  उसका error rate कितना कम है।

Error Rate क्या होता है ?

Actual output और Predicted output में जो अंतर होता है उसे error rate कहते है। error rate जितना ज़्यादा होगा आपके Model की accuracy उतनी कम होगी।

और Error rate जितना कम होगा आपका ML Model उतना ही accurate prediction देगा।

Training and Testing में कितना ratio होना चाहिए ?

इसका कोई rule नहीं है, आप अपने हिसाब से training और testing data को split कर सकते है।

पर बहुत से Machine Learning experts और Data Scientist का कहना है आप 80/20 का ratio रखिये यानी 80% data training के उपयोग में ले और 20% data को testing के उपयोग में ले।

और कुछ experts 70/30 का ratio भी recommend करते है।

तो यह निर्भर करता है आपके Dataset पर और आपके problem statement पर की आप training and testing में कितना ratio रखते है।

Understanding of Features and Labels

Feature

Feature को individual independent variables के रूप में परिभाषित किया जाता है जो input के रूप में कार्य करते हैं। Prediction models prediction करने के लिए Feature का उपयोग करते हैं। 

Label

Label को अंतिम output के रूप में परिभाषित किया जाता है। Output classes को Label के रूप में भी माना जा सकता है। Label को dependent variables के रूप में भी देखा जाता है।

इसे हम एक example से समझते है।

मान लीजिये आपके पास student’s का data है जिसमे students का CGPA, students का IQ और student placed हुआ है या नहीं यह data available है। 

अब यहाँ पर जो student का CGPA और student का IQ है यह सब independent variables है यानी यह कुछ भी हो सकते है।

और दूसरी तरफ student placed हुआ है या नहीं यह dependent variables है। यानी यह  IQ और CGPA पर dependent है।

मतलब student का IQ और CGPA एक threshold value को cross करेगा तभी वह student placement ले पाएगा।

यानी Placement dependent है IQ और CGPA पर तो यहाँ पर हम student के IQ और CGPA को Features consider कर सकते है और Placement record को Label consider कर सकते है। 

Student IQ , Student CGPA == Input data == Independent Variables   >> Features

Student Placement record   == Output data == Dependent Variables >> Label

Types of Machine Learning

Types of Machine Learning in Hindi

विभिन्न प्रकार के machine learning सिस्टम होते है । हम training के दौरान human supervision के type और amount के अनुसार machine learning system को classify कर सकते हैं।

आप ML के चार प्रमुख types पा सकते हैं।

– Supervised learning

– Unsupervised learning

– Semi-Supervised Learning

– Reinforcement Learning

यह Machine Learning in Hindi – Basic Guide आर्टिकल है तो यहाँ पर सारि ML algorithms को समझा पाना मुश्किल है। क्योकि हर algorithm अपने आप में एक विस्तृत टॉपिक है।

इस आर्टिकल में मैं आपको उनकी सिर्फ संक्षिप्त जानकारी प्रदान कर पाउँगा।

Supervised Learning

Supervised Learning में  हमारे पास data में input और output दोनों होता है। अगर आपके data में features और labels दोनों मौजूद है तो आप उस data पर supervised learning algorithms का प्रयोग कर सकते है।

Supervised Learning नाम से ही पता चलता है की यहाँ supervision या guidance की जरुरत होती है।

यानी यहाँ पर आपके पास input और output दोनों होते है बस आप इस डाटा को supervised algorithm में fit करते हो।

और model इस data के अनुसार आपको prediction देने लगता है। 

उदाहरण के तौर पर students का डाटा। आपको पता है की student का placement record स्टूडेंट के IQ और CGPA पर dependent है।

यानी IQ और CGPA आपके features और input data हुए और दूसरी तरफ Placement record आपके labels और output data हुए। 

अब आप इस डाटा को supervised algorithm में fit कर देंगे और फिर आपका model prediction देने लग जाएगा।  

Machine learning Algorithms for Supervised Learning

Machine learning Algorithms for Supervised Learning

Supervised ML में आप दो प्रकार के algorithms का इस्तेमाल करते है जैसे :

Regression

यदि input variable और output variable के बीच कोई संबंध है तो regression algorithm का उपयोग किया जाता है।

इसका उपयोग continuous variables की prediction के लिए किया जाता है, जैसे कि weather forecast, market trends, आदि।

Algorithms of Regression :

  • Linear Regression
  • Regression Trees
  • Non-Linear Regression
  • Bayesian Linear Regression
  • Polynomial Regression

Classification

Classification algorithms का उपयोग तब किया जाता है जब output variable categorical होता है, जैसे : yes-no, male-female, true-false,आदि।

Algorithms of classification:

  • Random Forest
  • Decision Trees
  • Logistic Regression
  • Support vector Machines

Unsupervised Learning

इस प्रकार के मशीन-लर्निंग सिस्टम में, आप अनुमान लगा सकते हैं कि डेटा बिना लेबल वाला है।

हमारे पास labeled किए गए data नहीं होते हैं और दिए गए dataset से छिपे हुए patterns को खोजने की आवश्यकता होती है।

Unsupervised learning एक प्रकार की मशीन लर्निंग है जिसमें model को बिना label वाले dataset का उपयोग करके trained किया जाता है

और बिना किसी supervision के उस data पर कार्य करने की अनुमति दी जाती है।

unsupervised learning का लक्ष्य dataset की underlying structure को खोजना है,

उस data को समानता के अनुसार group करना और उस dataset को एक compressed format में प्रस्तुत करना है।

Machine learning Algorithms for Unsupervised Learning

Machine learning Algorithms for Unsupervised Learning

Unsupervised ML में भी आप दो प्रकार के algorithms का इस्तेमाल करते है जैसे :

Clustering

Clustering objects को grouping करने की एक विधि है जैसे कि most similarity वाले  objects एक group में रहते हैं

और उनका किसी अन्य समूह के objects के साथ कोई काम या कोई समानता नहीं होती है। 

Cluster analysis data objects के बीच समानताएं ढूंढता है और उन्हें उन समानताओं की उपस्थिति और अनुपस्थिति के अनुसार classify करता है।

Association

Association नियम एक unsupervised learning पद्धति है जिसका उपयोग large datasets में variables के बीच संबंधों को खोजने के लिए किया जाता है।

यह dataset में एक साथ होने वाले  objects के set को निर्धारित करता है। Association नियम marketing strategy को और अधिक प्रभावी बनाता है।

Algorithms of Unsupervised Learning

  • K-means clustering
  • KNN (k-nearest neighbors)
  • Hierarchical clustering
  • Anomaly detection
  • Neural Networks
  • Principal Component Analysis
  • Independent Component Analysis
  • Singular value decomposition

Semi-Supervised learning

Semi-supervised learning मशीन लर्निंग सीखने के लिए एक दृष्टिकोण है जो training के दौरान large amount में unlabeled data के साथ labeled data की एक छोटी मात्रा को जोड़ता है।

Semi-supervised learning unsupervised learning (बिना label वाले training data) और supervised learning (केवल label किए गए training data) के बीच आता है।

हम कह सकते है की Semi-supervised learning मिश्रण है supervised और unsupervised Machine Learning का। 

Reinforcement Learning

Reinforcement Learning

Reinforcement learning को एक मशीन लर्निंग के रूप में परिभाषित किया गया है जो इस बात से संबंधित है कि software agents को एक environment में कैसे actions लेने चाहिए।

खास तोर पर Reinforcement learning deep learning का हिस्सा है। 

अगर Agent ने सही action लिया तो machine उसे reward करेगी और वही agent अगर गलत action लेता है तो  machine उसे punish करती है।

Reinforcement Learning Algorithms

  • Q-Learning
  • SARSA (State-Action-Reward-State-Action)
  • DQN    (Deep Q Network)
  • DDPG  (Deep Deterministic Policy Gradient)

Bad Quality Data for Training

Bad Quality Data for Training

Machine learning systems बच्चों की तरह नहीं हैं, जो सभी प्रकार के रंगों और आकारों में सेब और संतरे को अलग कर सकते हैं।

लेकिन Machine learning को प्रभावी ढंग से काम करने के लिए बहुत सारे data की आवश्यकता होती है।

चाहे आप बहुत ही सरल program और problem के साथ काम कर रहे हों, या बहुत ही complex program और problem के साथ।

ML Model को अच्छे से train करने के लिए आपको एक अच्छे amount के data की जरुरत होती है। वह data irrelevant और poor quality का नहीं होना चाहिए।

अगर ऐसा होता है तो Model गलत भी train हो सकता है। और ऐसा कोई भी Machine Learning engineer नहीं चाहता।

Poor quality of data

यदि आप training data के साथ काम कर रहे हैं जो errors और outliers से भरा है, तो इससे system के लिए pattern का पता लगाना बहुत कठिन हो जाएगा, और यह ठीक से काम नहीं करेगा।

इसलिए, यदि आप चाहते हैं कि आपका model अच्छी तरह से काम करे, तो आपको अपने training data को साफ करने में अधिक समय देना चाहिए। 

Irrelevant features

Model केवल तभी सीख पाएगा जब training data में पर्याप्त सुविधाएं हो और वह डेटा शामिल हो जो बहुत relevant हो।

किसी भी ML Model का सबसे महत्वपूर्ण हिस्सा अच्छी features का विकास करना है। अगर आपके features irrelevent हुए तो Model accuracy में error दे सकता है।

Concept of Overfitting and Underfitting

Concept of Overfitting and Underfitting in machine learning in Hindi

Overfitting एक मॉडलिंग error है जो तब होती है जब कोई फंक्शन data points के finite set के बहुत करीब से फिट होता है।

Underfitting एक ऐसे मॉडल को संदर्भित करता है जो न तो training data को मॉडल कर सकता है और न ही new data को normalized कर सकता है। overfitting और underfitting को आप ऐसे समझ सकते है।

Overfitting: training data पर अच्छा प्रदर्शन, अन्य data के लिए खराब सामान्यीकरण (generalization).

Underfitting: training data पर खराब प्रदर्शन और साथ ही अन्य data का भी खराब सामान्यीकरण (generalization).

एक अधिक complex model का उपयोग करना, उदाहरण के लिए एक linear से एक nonlinear मॉडल में switch करके या अपने neural network में hidden layers को जोड़कर, अक्सर Underfitting को हल करने में मदद मिलती है ।

आपके द्वारा उपयोग किए जाने वाले algorithm में Overfitting को रोकने के लिए default regularization पैरामीटर किये जाते हैं।

Advantages of Machine learning

Advantages of Machine learning in Hindi

जैसा की हम जानते की मशीन लर्निंग algorithm हमारे द्वारा प्रदान किए गए डेटा से सीखने में सक्षम हैं। जैसे ही नया डेटा प्रदान किया जाता है, मॉडल की accuracy और efficiency में सुधार होता है। 

मशीन लर्निंग को बड़े बड़े Tech-Giant’s जैसे Amazon, Walmart, Google, Facebook, Twitter इस्तेमाल करते है। और हर दिन भारी मात्रा में नया डेटा एकत्रित करते हैं।

मशीन लर्निंग की कुछ और विशेषताएं भी है जैसे :

– दोहराए जाने वाले कार्यों को Automatic कर देती है। 

– समय के साथ अपने आप में सुधार करती रहती है।  

– मशीन लर्निंग की बहुत सी applications है। 

– Trends और patterns को आसानी से पहचान सकती हैं।

Limitations of Machine Learning

Limitations of Machine Learning in Hindi

जैसा की मैंने आपको बताया है की Machine learning एक हद तक ही अपने आप को नए डाटा पर update कर पाती है।

कुछ amount डाटा तक हम मशीन लर्निंग का उपयोग कर सकते है पर जैसे-जैसे डाटा बढ़ता जायगा हमे मशीन लर्निंग की जगह deep learning का उपयोग लेना होगा। 

इसके अलावा machine learning की और कई limitations है जैसे :

– Machine learning algorithms के लिए training data के विशाल भंडार की आवश्यकता होती है।

– Training data को label करना एक कठिन प्रक्रिया है। 

– Quality data की कमी।

– Insufficient, excessive या unknown data के कारण होने वाले Errors.

– Supervised learning की आवश्यकता है जिसका अर्थ है कि human observation आवश्यक है। 

– मॉडल symbolic, high-level planning या logic के लिए उपयुक्त नहीं है। 

कुछ इन्ही तरह की limitations के कारण  हमे Deep Learning जैसी technology की जरुरत पड़ती है।

Final thoughts

तो यह था Machine learning in Hindi आर्टिकल। आशा करता हूँ की इस आर्टिकल को पढ़ने के बाद अब आपको Machine Learning के बारे में अच्छा ख़ासा ज्ञान प्राप्त हो गया होगा।

अगर हम सम्पूर्ण machine learning की बात करे तो वह काफी बड़ा विषय है उसे एक आर्टिकल में cover कर पाना मुश्किल है।

पर मैंने इस आर्टिकल को कुछ इस तरह लिखा है की अगर आपको मशीन लर्निंग के बारे में कुछ भी नहीं पता हो तो आप इस आर्टिकल के माध्यम से मशीन लर्निंग की जरुरी या basic जानकारी रख ले।

और मैंने मशीन लर्निंग की algorithms को विस्तृत रूप से नहीं समझाया है। क्युकी अगर मैं ऐसा करता तो यह आर्टिकल बहुत बड़ा हो सकता था और साथ ही सभी ML algorithms को एक आर्टिकल के माध्यम से समझा पाना मुश्किल भी है। 

पर मैं उम्मीद करता हूँ की आपको यह मशीन लर्निंग पर आर्टिकल पसंद आया होगा। 

अगर आपको यह आर्टिकल पसंद आया तो इसे अपने दोस्तों और सहपाठियों के साथ जरूर शेयर करे ताकि वे भी Machine learning के बारे में जान पाए। 

और भविष्य में ऐसी और जानकारियों के लिए बने रहे हमारे साथ HindiTechVarta पर मैं कोशिश करता रहूँगा की आप को Python और Data Science जैसे क्षेत्र में जानकारियां नियमित रूप से प्रदान करता रहूं।

Also, Check Out these Articles:

Leave a Reply

Your email address will not be published. Required fields are marked *

error: Content is protected !!