[ad_1]
रैखिक प्रतिगमन एक प्रकार का डेटा विश्लेषण है जो एक आश्रित चर और एक या अधिक स्वतंत्र चर के बीच रैखिक संबंध पर विचार करता है। इसका उपयोग आमतौर पर विभिन्न कारकों और परिणामों के फैलाव के बीच संबंध या सहसंबंध की ताकत को दिखाने के लिए किया जाता है – यह सब आश्रित चर के व्यवहार को समझाने के लिए किया जाता है।
एक रेखीय प्रतिगमन मॉडल का लक्ष्य चर के बीच संबंध की भयावहता का अनुमान लगाना है और यह सांख्यिकीय रूप से महत्वपूर्ण है या नहीं।
मान लीजिए कि हम आइसक्रीम खाने की मात्रा और मोटापे के बीच संबंध की मजबूती का परीक्षण करना चाहते थे। हम स्वतंत्र चर, आइसक्रीम की मात्रा, लेंगे और इसे आश्रित चर, मोटापे से जोड़ेंगे, यह देखने के लिए कि क्या कोई संबंध था। यह देखते हुए कि प्रतिगमन इस संबंध का एक ग्राफिकल प्रदर्शन है, डेटा में परिवर्तनशीलता जितनी कम होगी, संबंध उतना ही मजबूत होगा और प्रतिगमन रेखा पर फिट उतना ही मजबूत होगा।
वित्त में, रैखिक प्रतिगमन का उपयोग विभिन्न अनुप्रयोगों में परिसंपत्ति की कीमतों और आर्थिक डेटा के बीच संबंधों को निर्धारित करने के लिए किया जाता है। उदाहरण के लिए, इसका उपयोग फामा-फ़्रेंच मॉडल में कारक भार निर्धारित करने के लिए किया जाता है और यह पूंजी परिसंपत्ति मूल्य निर्धारण मॉडल (सीएपीएम) में स्टॉक के बीटा को निर्धारित करने का आधार है।
यहां, हम देखते हैं कि रैखिक प्रतिगमन करने के लिए Microsoft Excel में आयातित डेटा का उपयोग कैसे करें और परिणामों की व्याख्या कैसे करें।
चाबी छीनना
- रैखिक प्रतिगमन एक आश्रित और स्वतंत्र चर(चरों) के बीच संबंध को मॉडल करता है।
- सामान्य न्यूनतम वर्ग (ओएलएस) के रूप में भी जाना जाता है, एक रेखीय प्रतिगमन अनिवार्य रूप से मॉडल में सभी चर के बीच सबसे उपयुक्त रेखा का अनुमान लगाता है।
- प्रतिगमन विश्लेषण को मजबूत माना जा सकता है यदि चर स्वतंत्र हैं, कोई विषमलैंगिकता नहीं है, और चर की त्रुटि शर्तें सहसंबद्ध नहीं हैं।
- डेटा विश्लेषण टूलपैक के साथ एक्सेल में रैखिक प्रतिगमन मॉडलिंग करना आसान है।
- प्रतिगमन आउटपुट की व्याख्या आश्रित चर पर एक या अधिक चर के बीच सहसंबंध के आकार और ताकत दोनों के लिए की जा सकती है।
महत्वपूर्ण विचार
आपके डेटा सेट के बारे में कुछ महत्वपूर्ण धारणाएँ हैं जो प्रतिगमन विश्लेषण के साथ आगे बढ़ने के लिए सत्य होनी चाहिए। अन्यथा, परिणामों की गलत व्याख्या की जाएगी या वे पूर्वाग्रह प्रदर्शित करेंगे:
- चर वास्तव में स्वतंत्र होने चाहिए (ची-स्क्वायर परीक्षण का उपयोग करके)।
- डेटा में अलग-अलग त्रुटि भिन्नताएं नहीं होनी चाहिए (इसे हेटेरोस्केडैस्टिसिटी कहा जाता है (इसे हेटेरोस्केडैस्टिसिटी भी कहा जाता है))।
- प्रत्येक चर की त्रुटि शर्तें असंबंधित होनी चाहिए। यदि नहीं, तो इसका मतलब है कि चर क्रमिक रूप से सहसंबद्ध हैं।
यदि वे तीन बिंदु जटिल लगते हैं, तो वे हो सकते हैं। लेकिन उन विचारों में से एक का प्रभाव सत्य न होना एक पक्षपातपूर्ण अनुमान है। मूलतः, आप जिस रिश्ते को माप रहे हैं उसे गलत बताएँगे।
एक्सेल में एक रिग्रेशन आउटपुट करना
एक्सेल में रिग्रेशन विश्लेषण चलाने में पहला कदम यह जांचना है कि मुफ्त एक्सेल प्लगइन डेटा विश्लेषण टूलपैक स्थापित है। यह प्लगइन आँकड़ों की एक श्रृंखला की गणना करना बहुत आसान बनाता है। यह है नहीं एक रेखीय प्रतिगमन रेखा को चार्ट करने के लिए आवश्यक है, लेकिन यह सांख्यिकी तालिकाओं को बनाना आसान बनाता है। स्थापित होने की पुष्टि करने के लिए, टूलबार से “डेटा” चुनें। यदि “डेटा विश्लेषण” एक विकल्प है, तो सुविधा स्थापित है और उपयोग के लिए तैयार है। यदि इंस्टॉल नहीं है, तो आप ऑफिस बटन पर क्लिक करके और “ऐड-इन” के लिए “विकल्प” का चयन करके इस विकल्प का अनुरोध कर सकते हैं और “प्रबंधित करें” बॉक्स से, “एक्सेल ऐड-इन” का चयन करें और “गो” पर क्लिक करें।
डेटा विश्लेषण टूलपैक का उपयोग करके, रिग्रेशन आउटपुट बनाना केवल कुछ ही क्लिक में होता है।
Excel में स्वतंत्र चर X श्रेणी में जाता है।
एसएंडपी 500 रिटर्न को देखते हुए, मान लीजिए कि हम जानना चाहते हैं कि क्या हम वीज़ा (वी) स्टॉक रिटर्न की ताकत और संबंध का अनुमान लगा सकते हैं। वीज़ा (वी) स्टॉक रिटर्न डेटा कॉलम 1 को आश्रित चर के रूप में पॉप्युलेट करता है। S&P 500 रिटर्न डेटा कॉलम 2 को स्वतंत्र चर के रूप में पॉप्युलेट करता है।
- टूलबार से “डेटा” चुनें. “डेटा” मेनू प्रदर्शित होता है.
- “डेटा विश्लेषण” चुनें। डेटा विश्लेषण – विश्लेषण उपकरण संवाद बॉक्स प्रदर्शित होता है।
- मेनू से, “रिग्रेशन” चुनें और “ओके” पर क्लिक करें।
- रिग्रेशन संवाद बॉक्स में, “इनपुट वाई रेंज” बॉक्स पर क्लिक करें और निर्भर चर डेटा (वीज़ा (वी) स्टॉक रिटर्न) का चयन करें।
- “इनपुट एक्स रेंज” बॉक्स पर क्लिक करें और स्वतंत्र चर डेटा (एस एंड पी 500 रिटर्न) का चयन करें।
- परिणाम चलाने के लिए “ओके” पर क्लिक करें।
(नोट: यदि तालिका छोटी लगती है, तो छवि पर राइट-क्लिक करें और उच्च रिज़ॉल्यूशन के लिए इसे एक नए टैब में खोलें।)
परिणामों की व्याख्या करें
उस डेटा का उपयोग करते हुए (हमारे आर-स्क्वायर आलेख से समान), हमें निम्नलिखित तालिका मिलती है:
आर2 मूल्य, जिसे निर्धारण के गुणांक के रूप में भी जाना जाता है, स्वतंत्र चर द्वारा समझाए गए आश्रित चर में भिन्नता के अनुपात को मापता है या प्रतिगमन मॉडल डेटा को कितनी अच्छी तरह फिट करता है। आर2 मान 0 से 1 तक होता है, और उच्च मान बेहतर फिट का संकेत देता है। पी-मान, या संभाव्यता मान, भी 0 से 1 तक होता है और इंगित करता है कि परीक्षण महत्वपूर्ण है या नहीं। आर के विपरीत2 मूल्य, एक छोटा पी-मूल्य अनुकूल है क्योंकि यह आश्रित और स्वतंत्र चर के बीच सहसंबंध को इंगित करता है।
यहां लब्बोलुआब यह है कि वीज़ा स्टॉक में बदलाव एसएंडपी 500 के साथ अत्यधिक सहसंबद्ध प्रतीत होते हैं।
- उपरोक्त प्रतिगमन आउटपुट में, हम देख सकते हैं कि वीज़ा में प्रत्येक 1-बिंदु परिवर्तन के लिए, एसएंडपी 500 में संबंधित 1.36-बिंदु परिवर्तन होता है।
- हम यह भी देख सकते हैं कि पी-वैल्यू बहुत छोटा है (0.000036), जो एक बहुत बड़े टी-टेस्ट से भी मेल खाता है। यह इंगित करता है कि यह खोज सांख्यिकीय रूप से अत्यधिक महत्वपूर्ण है, इसलिए यह संभावना बहुत कम है कि यह परिणाम संयोगवश उत्पन्न हुआ।
- आर-वर्ग से, हम देख सकते हैं कि वी मूल्य अकेले एसएंडपी 500 सूचकांक में देखे गए 62% से अधिक उतार-चढ़ाव की व्याख्या कर सकता है।
हालाँकि, इस बिंदु पर एक विश्लेषक निम्नलिखित कारणों से थोड़ी सावधानी बरत सकता है:
- मॉडल में केवल एक वैरिएबल के साथ, यह स्पष्ट नहीं है कि क्या V S&P 500 कीमतों को प्रभावित करता है, क्या S&P 500 V कीमतों को प्रभावित करता है, या क्या कोई न देखा गया तीसरा वैरिएबल दोनों कीमतों को प्रभावित करता है।
- वीज़ा एसएंडपी 500 का एक घटक है, इसलिए यहां चर के बीच सह-संबंध हो सकता है।
- केवल 20 अवलोकन हैं, जो एक अच्छा अनुमान लगाने के लिए पर्याप्त नहीं हो सकते हैं।
- डेटा एक समय श्रृंखला है, इसलिए इसमें स्वत: सहसंबंध भी हो सकता है।
- अध्ययनाधीन समयावधि अन्य समयावधियों का प्रतिनिधि नहीं हो सकती है।
एक्सेल में रिग्रेशन को चार्ट करना
हम एक्सेल में डेटा को हाइलाइट करके और इसे स्कैटर प्लॉट के रूप में चार्ट करके एक रिग्रेशन चार्ट कर सकते हैं। एक प्रतिगमन रेखा जोड़ने के लिए, “चार्ट डिज़ाइन” मेनू से “चार्ट तत्व जोड़ें” चुनें। संवाद बॉक्स में, “ट्रेंडलाइन” और फिर “लीनियर ट्रेंडलाइन” चुनें। आर जोड़ने के लिए2 मान, “ट्रेंडलाइन” मेनू से “अधिक ट्रेंडलाइन विकल्प” चुनें। अंत में, “चार्ट पर आर-वर्ग मान प्रदर्शित करें” चुनें। दृश्य परिणाम रिश्ते की मजबूती को दर्शाता है, भले ही ऊपर दी गई तालिका में उतना विवरण प्रदान न करने की कीमत पर।
आप रेखीय प्रतिगमन की व्याख्या कैसे करते हैं?
एक प्रतिगमन मॉडल का आउटपुट विभिन्न संख्यात्मक परिणाम उत्पन्न करेगा। गुणांक (या बीटा) आपको एक स्वतंत्र चर और आश्रित चर के बीच संबंध बताते हैं, बाकी सब कुछ स्थिर रखते हुए। यदि गुणांक, मान लीजिए, +0.12 है, तो यह आपको बताता है कि उस चर में प्रत्येक 1-बिंदु परिवर्तन उसी दिशा में आश्रित चर में 0.12 परिवर्तन के अनुरूप है। यदि इसके बजाय -3.00 होता, तो इसका मतलब होता कि व्याख्यात्मक चर में 1-बिंदु परिवर्तन के परिणामस्वरूप आश्रित चर में विपरीत दिशा में 3x परिवर्तन होता।
आप कैसे जानेंगे कि कोई प्रतिगमन महत्वपूर्ण है?
बीटा गुणांक उत्पन्न करने के अलावा, एक प्रतिगमन आउटपुट प्रत्येक गुणांक की मानक त्रुटि (जैसे पी-मूल्य और आत्मविश्वास अंतराल) के आधार पर सांख्यिकीय महत्व के परीक्षणों को भी इंगित करेगा। अक्सर, विश्लेषक महत्व दर्शाने के लिए 0.05 या उससे कम के पी-वैल्यू का उपयोग करते हैं; यदि पी-मान अधिक है, तो आप परिणामी बीटा गुणांक के लिए मौका या यादृच्छिकता से इनकार नहीं कर सकते। प्रतिगमन मॉडल में महत्व के अन्य परीक्षण प्रत्येक चर के लिए टी-परीक्षण हो सकते हैं, साथ ही मॉडल में सभी चर के संयुक्त महत्व के लिए एफ-सांख्यिकी या ची-वर्ग भी हो सकते हैं।
आप रेखीय प्रतिगमन के आर-वर्ग की व्याख्या कैसे करते हैं?
आर2 (आर-वर्ग) एक रैखिक प्रतिगमन मॉडल (0.00 से 1.00 तक) के फिट की अच्छाई का एक सांख्यिकीय माप है, जिसे निर्धारण के गुणांक के रूप में भी जाना जाता है। सामान्य तौर पर, R जितना अधिक होगा2, मॉडल का फिट उतना ही बेहतर होगा। आर-वर्ग की व्याख्या इस रूप में भी की जा सकती है कि मॉडल में स्वतंत्र (व्याख्यात्मक) चर द्वारा आश्रित चर में कितनी भिन्नता को समझाया गया है। इस प्रकार, 0.50 का आर-वर्ग बताता है कि आश्रित चर में देखी गई सभी भिन्नताओं में से आधे को आश्रित चर द्वारा समझाया जा सकता है।
तल – रेखा
आप दो या दो से अधिक चरों की तुलना करने के लिए रैखिक प्रतिगमन का उपयोग कर सकते हैं, जैसे बेंचमार्क के साथ एक विशिष्ट स्टॉक, उनकी निर्भरता निर्धारित करने के लिए, जो कुछ निवेश निर्णय लेने में मदद कर सकता है। प्रक्रिया को सरल बनाने के लिए एक्सेल में एक रेखीय प्रतिगमन मॉडल बनाया जा सकता है।
[ad_2]
Source link