הקריה האקדמית אונו | סטטיסטיקה למנהל עסקים

סיון ריף ǀ שרבל שוקייר

סטטיסטיקה למנהל עסקים

21. הצגה וניתוח של קשר בין משתנים

מבוא – רגרסיה לינ יארית

רגרסיה לינ י ארית היא שיטה סטטיסטית נפוצה ביותר המשמשת למטרות חיזוי ובדיקת קשר

בין משתנים. ההנחה במודל היא שהמשתנה התלוי הוא פונקציה לינארית של המשתנה או

המשתנים הבלתי תלויים. לדוגמה: אפשר לנסות לחזות את רמת ההכנסה לפי מספר שנות

הלימוד ואת הסיכוי לחלות במחלה מסוימת לפי מספר שעות הפעילות הגופנית ביום. במימון

משתמשים במודל הרגרסיה הלינארית על מנת לחזות את תשואות מניות לפי תשואות

השוק.

המקרה הפשוט ביותר הוא זה שקיימים בו שני משתנים:

– X משתנה מסביר (בלתי תלוי)

– Y משתנה מוסבר (תלוי)

כלומר X מסביר את .Y

מטרת קו הרגרסיה הוא לנבא קשר בין שני משתנים, או לנבא א ת ערכי ה משתנה התלוי

באמצעות המשת נה הבלתי תלוי.

הנוסחה הבסיסית של קו הרגרסיה מבוססת על נוסחת הקו הישר:

ˆ i

Y a bx

   

i

i

כאשר ˆ i Y מייצג את התחזית של המשתנה התלוי Y עבור תצפית ,i i X מייצג את הערך של

המשתנה הבלתי תלוי עבור תצפית a ,i הוא החותך של הקו הישר ו b הוא שיפוע הקו .  אפסילון מייצג את הסטיות מקו הרגרסיה (ההפרש בין הערך בפועל לבין הערך החזוי לפי

המודל), "רעש" שאינו מוסבר על ידי המודל עצמו . המטרה בבניית מודל רגרסיה לינארית

היא למצוא את הקו הישר בעל הסטיות המינימליו ת.

מודל הרגרסיה נבנה על בסיס דיאגרמת פיזור, כאשר דיאגרמת הפיזור עבור שני משתנים

מציגה את המיקום של כל תצפית מבין n התצפיות כנקודה במישור ( .)X,Y

94

Made with FlippingBook - Online Brochure Maker