Study Notes on Correlation and Regression

By Tanuj Bansal|Updated : August 12th, 2020

                                                                                                                                                                                                                                                                                                                                                                                                                       

सहसंबंध

एक व्यक्ति स्वयं को एकरूपी वितरण में परिभाषित कर सकता है, अर्थात वितरण केवल एक चर पर आधारित होता है। हालाँकि, हम एक या दो से अधिक चरों को भी देख सकते हैं। उदाहरण के लिए, ऊँचाई-भार; विज्ञापन-बिक्री; आय और व्यय; कीमत और मांग; कीमत और आपूर्ति, आदि।

इसके अलावा, यह पता लगाने में भी रुचि हो सकती है कि क्या दो चरों के बीच कोई संबंध है। चरों के बीच सहसंबंध की निम्नलिखित संभावनाएं हो सकती हैं:

  1. दोनों चर एक ही दिशा में परिवर्तित होते हैं [यदि एक चर बढ़ता है (या घटता है), तो दूसरा चर भी बढ़ता है (या घटता है]]
  2. दोनों चर विपरीत दिशा में परिवर्तित होते हैं [यदि एक चर बढ़ता है (या घटता है), तो दूसरा चर घटता है (या बढ़ता है)

इस प्रकार सहसंबंध के प्रकार इस प्रकार हैं:

  • यदि दोनों चर एक ही दिशा में परिवर्तित होते हैं तो सहसंबंध को सकारात्मक सहसंबंध कहा जाता है और
  • यदि वे विपरीत दिशा में परिवर्तित होते हैं तो सहसंबंध को नकारात्मक सहसंबंध कहा जाता है।
  • सहसंबंध को पूर्ण कहा जाता है यदि एक चर में विचलन के बाद, दूसरे चर में एक संगत और आनुपातिक विचलन होता है।

सहसंबंध गुणांक की गणना करने के दो तरीके हैं

प्रकीर्ण आरेख; और कार्ल पियर्सन सहसंबंध गुणांक

1. प्रकीर्ण आरेख

यदि चरों X और Y के मानों को xy-तल में क्रमशः x-अक्ष और y-अक्ष के अनुदिश खींचा जाता है, तो प्राप्त बिंदुओं के आरेख को प्रकीर्ण आरेख के रूप में जाना जाता है।

प्रकीर्ण आरेख  से, हम एक अच्छा विचार प्राप्त कर सकते हैं-

  • यदि बिंदु बहुत घने हैं तो हम इन दोनों चरों के बीच एक मजबूत सहसंबंध मान सकते हैं
  • यदि बिंदु पूरे तल में बिखरे हुए हैं, तो xy-तल में खींचे गए दोनों चरों के बीच ख़राब सहसंबंध होता है

इस विधि की कुछ हानियां हैं:

  • प्रेक्षणों की संख्या बड़ी होने पर यह विधि उपयुक्त नहीं है
  • यह विधि सहसंबंध का एक संख्यात्मक मान देने में सक्षम नहीं है

3. कार्ल पियर्सन सहसंबंध गुणांक

दोनों चरों के बीच रैखिक संबंध की डिग्री की माप के रूप में, कार्ल पियर्सन ने कार्ल पियर्सन सहसंबंध गुणांक नामक एक सूत्र विकसित किया।

byjusexamprep

सहसंबंध गुणांक के गुण

  1. यह कोटि में परिवर्तन और मूल बिंदु में परिवर्तन से स्वतंत्र होता है अर्थात यदि u=x-h/a , v=x-k/b है, तो r (x, y) = r (u, v)
  2. r (x, y) की सीमा -1 से 1 है
  3. r(x,y) केवल इन दो चरों के बीच रैखिक संबंध की एक माप प्रदान करता है; यह अरैखिक संबंध के लिए उपयुक्त नहीं है।
  4. दो स्वतंत्र चर सहसंबंधित होते हैं, यदि स्वतंत्र चर के लिए, cov(x,y)=0
  5. दो असहसंबंधित चर (शून्य सहसंबंध और शून्य सहप्रसरण) स्वतंत्र नहीं होते हैं।
  6. शून्य सहसंबंध का अर्थ रैखिक स्वतंत्रता से है।

 

सहसंबंध गुणांक की संभावित त्रुटि

यदि n प्रेक्षण युग्मों के एक प्रतिदर्श में r प्रतिदर्श सहसंबंध गुणांक है, तो यह मानक त्रुटि है

 

byjusexamprep

गुणनखंड 0 · 6745 को लेने का कारण यह है कि सामान्य वितरण में, परिसर 1.1 ± 0·6745 σ कुल क्षेत्र का 50% कवर करता है।

कोटि सहसंबंध

आइए, हम दो विशेषताओं A और B को रखने में योग्यता या प्रवीणता के क्रम में व्यवस्थित n व्यक्तियों के एक समूह को लेते हैं, सामान्य रूप से इन दोनों विशेषताओं में ये कोटियां अलग-अलग होंगी। उदाहरण के लिए,

यदि हम बुद्धि और शक्ति के बीच के संबंध पर विचार करते हैं। यह आवश्यक नहीं है कि एक शक्तिशाली व्यक्ति बुद्धिमान भी हो। माना कि  (Xi. Yi); i = 1, 2, …, n, क्रमशः दो विशेषताओं A और B में iवें व्यक्ति की कोटि है।

Xi और Yi की कोटियों के बीच पियर्सन के सहसंबंध गुणांक को A और B के बीच व्यक्तियों के उस समूह के लिए कोटि सहसंबंध गुणांक कहा जाता है

 

byjusexamprep

ध्यान दीजिए:

  1. स्पीयरमैन का कोटि सहसंबंध और कुछ नहीं बल्कि कोटियों के बीच कार्ल पियर्सन का सहसंबंध गुणांक है, इसलिए इसे कार्ल पियर्सन के सहसंबंध गुणांक के रूप में समझाया जा सकता है।
  2. कार्ल पियर्सन के सहसंबंध गुणांक की तुलना में स्पीयरमैन के कोटि सहसंबंध की गणना करना आसान है।
  3. गुणात्मक आंकड़ों के साथ कार्य करते समय, स्पीयरमैन के सहसंबंध गुणांक का उपयोग किया जाना चाहिए।

प्रतिगमन (Regression) विश्लेषण

  • प्रतिगमन विश्लेषण दो चरों के बीच संबंध के औसत माप की एक माप है।
  • इसका अर्थ है कि "औसत की ओर पीछे हटना"।
  • प्रतिगमन विश्लेषण में, दो प्रकार के चर होते हैं
    • जो प्रभावित होता है या किसी अन्य चर द्वारा अनुमानित होता है, उसे आश्रित चर कहा जाता है (प्रतिगामी, समझाया गया)।
    • जो एक अन्य चर को प्रभावित करता है, उसे स्वतंत्र चर (प्रतिगामी, भविष्यवादी और व्याख्यात्मक) कहा जाता है।
  • आइए हम एक द्विचर आंकडें लेते हैं , माना कि x और y। इसलिए यदि x और y संबंधित हैं, तो हम पाएंगे कि प्रकीर्ण आरेख में बिंदु एक वक्र के चारों ओर समूहित होते हैं, जिसे "प्रतिगमन वक्र" कहते हैं। यदि वक्र एक सीधी रेखा है तो हम इसे "प्रतिगमन रेखा" कहते हैं।
  • प्रतिगमन रेखा वह रेखा है जो किसी एक चर के मान का दूसरे चर के किसी विशिष्ट मान के लिए सबसे अच्छा अनुमान देती है। इस प्रकार प्रतिगमन रेखा "सर्वश्रेष्ठ" की रेखा है और निम्नतम वर्गों के सिद्धांतों द्वारा प्राप्त की जाती है।

 

  • माना कि x एक स्वतंत्र चर है और y एक आश्रित चर है और (xi, yi), x और y के n प्रेक्षण हैं।
  • और x पर y की प्रतिगमन रेखा है
  • y=a+bx
  • a को अंत:खंड पद कहा जाता है
  • b को ढाल पद कहा जाता है
  • निम्नतम वर्गों के सिद्धांत के अनुसार, a और b के अनुमान के लिए, हमारे पास निम्नलिखित दो समीकरण हैं, इन्हें अभिलंब समीकरण कहा जाता है

byjusexamprep

byjusexamprep

Mock tests for UGC NET Exam

UGC NET Online Coaching

Thanks.
Score better. Go BYJU'S Exam Prep.

Comments

write a comment

UGC NET & SET

UGC NETKSETTNSET ExamGSET ExamMH SETWB SETMP SETSyllabusQuestion PapersPreparation
tags :UGC NET & SETPaper IIUGC NET OverviewUGC NET Admit CardUGC NET SyllabusUGC NET Preparation TipsUGC NET Books

Follow us for latest updates