תוחלת
מתוך ויקיפדיה, האנציקלופדיה החופשית
בתורת ההסתברות, התוחלת (או התוחלת המתמטית) של משתנה מקרי היא סכום כל המכפלות של כל אחד מן הערכים השונים אותם יכול לקבל המשתנה בהסתברויות המתאימות לקבלת אותם ערכים. הגדרה זו מתייחסת למשתנה מקרי בדיד. בהגדרה קצת שונה (במקרה של מרחב הסתברות בדיד), ניתן להתייחס לתוחלת של משתנה מקרי כאל סכום כל המכפלות של ערכי המשתנה בהסתברות המתאימה, כאשר הסכימה מתבצעת על פני כל נקודות מרחב המדגם (במדעים אמפיריים: כל התוצאות האפשריות של הניסוי). התוחלת מייצגת את התוצאה הממוצעת אם חוזרים על ניסוי זהה פעמים רבות. באופן עממי, התוחלת היא ממוצע של כל הערכים האפשריים בניסוי.
תוכן עניינים |
[עריכה] רקע
מבחינה היסטורית עלה מושג התוחלת כתשובה לבעייה שהטרידה מהמרים רבים. הבעייה הייתה לקבוע האם משחק מזל פלוני הוא "הוגן" או לא. הוגן במובן זה שלאף אחד מהצדדים המשחקים אין יתרון על יריבו. התשובה לבעיה ניתנה באמצעות חישוב ערך התוחלת של המשחק. משחק נחשב הוגן אם התוחלת שלו היא 0. לפיכך ניתן לפרש את התוחלת גם כדמי ההשתתפות ההוגנים במשחק מזל, משחק מהסוג שבו כל דמי ההשתפות הולכים לחלוקת הפרסים והמארגן לא משאיר לעצמו רווח.
לדוגמה, בגלגל רולטה ישנן 38 תוצאות אפשריות. הימור על מספר אחד נעשה ביחס של 35 ל-1 (כלומר כשהמהמר זוכה הוא מקבל פי 35 מסכום ההימור, ויחד עם סכום ההימור שמוחזר לו, הוא מקבל פי 36 מסכום ההימור). תוחלת הרווח מהימור של שקל אחד על מספר יחיד היא: 0.0526- = (1- × 37/38) + (35 × 1/38).
התקבלה תוחלת שונה מ-0, מכאן שמשחק הרולטה איננו הוגן במונחי תוחלת. יתרה מזאת, מכיוון שהתוחלת שחושבה שלילית, ניתן לצפות (בממוצע) להפסד של מעט יותר מחמש אגורות על כל שקל שמהמרים עליו. המסקנה היא שלשחקן אחד - הקזינו (מפעיל הרולטה), יש יתרון על השחקן האחר - המהמר.
התוחלת מייצגת תוצאה "צפויה" (Expected) של ניסוי זהה החוזר על עצמו פעמים רבות. מכאן מקורו של המונח בלועזית. אך אפשר שהערך של התוחלת עצמו לא יהיה תוצאה "צפויה" במובן המקובל, הוא עשוי להיות נדיר או אפילו בלתי אפשרי. (ראו דוגמה להמחשה).
[עריכה] הגדרה
התוחלת מסומלת על ידי או .
כאשר X הוא משתנה מקרי בדיד שמקבל את הערכים ...,x1, x2 בהסתברויות ...,p1, p2 בהתאמה, תחושב על ידי הסכום (או הטור):
- (כמו בדוגמת הרולטה לעיל ובדוגמה להלן).
במקום לסכם על ערכי המשתנה, אפשר לסכם על המאורעות במרחב המדגם Ω:
כאשר X הוא משתנה מקרי רציף, דהיינו בעל פונקציית צפיפות הסתברות אזי תחושב התוחלת על ידי:
בצורה הכללית, אם X הוא משתנה מקרי המוגדר על מרחב הסתברות (Ω, F, P), אזי התוחלת של X מוגדרת על ידי:
כאשר האינטגרל הוא אינטגרל לבג.
התוחלת קיימת רק כאשר האינטגרל מתכנס בהחלט.
מומנטים: התוחלות של החזקות השלמות של X נקראות המומנטים של X. המומנטים סביב התוחלת של X מוגדרים כתוחלות של החזקות השלמות של X - EX.
אמידה: כדי לאמוד את התוחלת של משתנה מקרי באופן אמפירי, מבצעים מדידות חוזרות של המשתנה ומחשבים את הממוצע החשבוני של התוצאות. לאומדן זה יש התכונה שהוא ממזער את סכום ריבועי השגיאות ביחס לתוחלת.
[עריכה] דוגמה
נדגים את חישוב התוחלת של משתנה מקרי בדיד.
כאשר מטילים קוביה הוגנת (בעלת שש פאות) ההסתברות לקבלת כל מספר מ-1 עד 6 שווה ל-1/6. התוחלת תחושב באופן הבא:
דוגמה זו ממחישה שתי תכונות של התוחלת:
- תוצאה צפויה: ערך התוחלת (3.5) לא חייב להיות אחד הערכים של המשתנה המקורי (המספרים השלמים 1-6).
- כאשר ההסתברות בניסוי לקבלת כל תוצאה היא שווה אזי התוחלת היא הממוצע החשבוני.
ניתן לתת לתוחלת את הפירוש הבא: אם משלמים למהמר לפי תוצאות הטלת הקוביה, דהיינו במקרה שייצא 1 - יקבל 1 ש"ח, במקרה שייצא 6 - יקבל 6 ש"ח, הרי שהסכום הממוצע שהמהמר צפוי לקבל לאחר 10 הטלות של הקוביה הוא ש"ח.
[עריכה] תכונות התוחלת
- לשני משתנים מקריים בעלי אותה התפלגות תהיה אותה תוחלת.
אופרטור התוחלת E הוא לינארי, לפיכך:
(X ,Y משתנים מקריים המוגדרים על אותו מרחב הסתברות ו- a ,b מספרים ממשיים)
- אופרטור התוחלת אינו כפלי, כלומר, השוויון אינו מתקיים בדרך כלל. כאשר השוויון מתקיים, אומרים שהמשתנים X ו-Y בלתי מתואמים. כל שני משתנים בלתי תלויים הם גם בלתי מתואמים. ההפרש הוא השונות המשותפת, שממנה אפשר לחשב את המתאם.
[עריכה] תוחלת של זמן המתנה
אם X הוא משתנה מקרי המקבל רק ערכים שלמים חיוביים, אז התוחלת שלו מקיימת (לנוסחה זו יש גם גרסאות כלליות יותר). ביטוי זה לחישוב התוחלת שימושי במקרה שהמשתנה מייצג את זמן ההמתנה עד להתרחשותו של מאורע (כגון - הופעתה הראשונה של המלה "אנציקלופדיה" בסדרה של תווים אקראיים).