סטטיסטיקה
מתוך ויקיפדיה, האנציקלופדיה החופשית
סטטיסטיקה היא מדע העוסק באיסוף נתונים, ניתוח כמותי שלהם והסקת מסקנות בהתאם. הסטטיסטיקה היא ענף במתמטיקה ובפרט קשורה להסתברות.
במקרים רבים קשה לנתח את האיברים בקבוצה באופן פרטני בשל מספרם הרב, ואז אפשר להתייחס אל הנתונים כמכלול, ולנתחם ככאלה. כאשר מסתכלים על משתנה מסוים (למשל מידת גובה) והופעתו באוכלוסייה מסוימת (למשל ילדי כתה ג' בישראל), מתקבלת התפלגות של משתנה מקרי (הגובה). במקרים רבים ניתן לדגום מדגם שייצג את האוכלוסייה לצורך הסקה סטטיסטית.
הסטטיסטיקה מתחלקת לסטטיסטיקה תיאורית, שמטרתה תיאור של הנתונים על ידי אפיון ממדים שונים בהם, וסטטיסטיקה היסקית, שמטרתה הסקת מסקנות מהמדגם עליו נאספו הנתונים הסטטיסטיים לכל האוכלוסייה.
תוכן עניינים |
[עריכה] סטטיסטיקה תיאורית
בסטטיסטיקה תיאורית ישנם סוגים שונים של מדדים, שלכל אחד מהם מטרה אחרת. יש להבדיל בין פרמטרים של האוכלוסייה, שהם הערכים התיאורטים המאפיינים את האוכלוסייה, לבין אומדים לפרמטרים הללו, שהם ערכים המופקים מהמדגם ותלויים בו.
[עריכה] הצגה גרפית
הצגה גרפית היא דרך לתאר התפלגות של משתנה מקרי בצורה ויזואלית.
- דיאגרמת מקלות - על ציר ה-X ערכי המשתנים, ציר ה-Y הוא תדירויות הופעת משתנה בערך מסוים. על כל ערך אפשרי של המשתנה ניצב "מקל" בגובה פרופורציוני למספר הפעמים שערך זה מופיע במדגם.
- היסטוגרמה - על ציר ה-X קטגוריות של ערכי משתנים (למשל טווח ערכים). מעל כל קטגוריה ניצב מלבן בעל שטח פרופורציוני למספר הפעמים שערכי הקטגוריה מופיעים במדגם.
- דיאגרמת עוגה - תרשים בצורת מעגל המציג התפלגות: שטח המעגל צבוע בצבעים שונים, כפרוסות בעוגה, כאשר הזוית המוקדשת לכל צבע נמצאת בפרופורציה לתדירות הופעת ערכי הקגוריות השונות.
[עריכה] מדדי מרכז
מטרתם של מדדי מרכז היא אפיון מרכז ההתפלגות. ההבדל ביניהם הוא במידת רגישותם לערכים קיצוניים.
- ממוצע - הערך המרכזי בתוך קבוצה של ערכים. מתקבל מסיכום האיברים בקבוצה הנדונה, וחלוקת הסכום במספר האיברים.
- חציון - הערך שנמצא באמצע קבוצת הנתונים, כאשר היא מסודרת בסדר עולה, מהקטן אל הגדול. כאשר מספר הנתונים זוגי, החציון הוא ממוצע שני הנתונים האמצעיים.
- שכיח - הערך המופיע מספר הפעמים הגדול ביותר במדגם.
[עריכה] מדדי פיזור
בניגוד למדדי מרכז, המאפיינים את המשותף לכל הערכים, מדדי פיזור מודדים את ההבדל בין הערכים שבמדגם.
- טווח - המדידה הפשוטה ביותר של הפיזור היא הטווח - המרחק בין הערך הגדול ביותר לבין הערך הקטן ביותר (R = Xmax - Xmin). מדידה זו מושפעת ביותר מערכים קיצוניים.
- טווח בין רבעוני - המרחק בין הרבעון הראשון לבין הרבעון השלישי.
- שונות - מדד המאפיין את השונות של הערכים, כלומר מידת ריחוקם מהערך הממוצע. מחושב כממוצע ריבועי הסטיות מהממוצע.
- סטיית התקן - מדד המתבסס על השונות, ומשמש לאותו צורך. מחושב כשורש ריבועי של השונות. הצורך במדד זה נובע מהעובדה שבתהליך חישוב השונות יש העלאה בריבוע, ולכן הערך המתקבל אינו באותן יחידות של ערכי המדגם. סטיית התקן היא באותן יחידות.
- התפלגות - אפיון הערכים על פי מידת פיזורם במרחב. לדוגמה התפלגות אחידה, התפלגות נורמלית, התפלגות פואסונית.
[עריכה] מדדי מיקום
מדדי מיקום הם מדדים המאפשרים להעריך את מיקומו של פרט ביחס באופן יחסי לשאר המדגם.
- אחוזון - האחוזון מבטא את מיקומו של הערך בסדרת הנתונים, כאשר זו מסודרת בסדר עולה. בסדרת הנתונים {1, 4, 7, 8, 14} מיקומו של הפריט 4 הוא באחוזון ה- 20. בדומה לאחוזונים, ניתן לבטא את מיקומו של פריט בשברים אחרים, כגון חמישונים, עשירונים וכדומה.
- ציון תקן - ציון תקן הוא המרחק של הפריט מהממוצע, ביחידות של סטיית התקן.
[עריכה] מדדי קשר
מדדי קשר הם מדדים המאפשרים להעריך את טיב הקשר בין שני משתנים שונים - האם יש קשר בין שינוי באחד מהם לשינוי בשני. קיימים מספר מדדי קשר, בהתאם לסולם המדידה של המשתנים הנמדדים. במקרה של אי התאמה בין הסולמות של שני משתנים, יש להשתמש במדד המתאים לסולם הנמוך מבין השניים.
- מתאם קרמר - למשתנים שמיים.
- מדד למדה - למשתנים שמיים.
- מתאם ספירמן - למשתני סדר.
- מתאם פירסון - למשתני רווח ומנה.
- מתאם פי - דרך מקוצרת לחישוב מתאם פירסון.
- מדד אתה - למשתני מנה.
[עריכה] סטטיסטיקה היסקית
סטטיסטיקה היסקית עוסקת בנסיון להגיע למסקנות לגבי האוכלוסייה מתוך נתוני המדגם.
- מודלים
- מודלים סטטיסטיים הם שיטות מתמטיות המאפשרות לגזור מתוך נתוני המדגם נוסחה המאפשרת לנבא את ערכו של המשתנה התלוי בהינתן המשתנים הבלתי-תלויים. מספר המודלים הוא רב מאוד, ותלוי בסולם המדידה של כל אחד מהמשתנים, בקשרים אותם מעוניינים לחקור ובאופי הקשר המשוער בין המשתנים.
המודל הפשוט ביותר, וזה הנמצא בשימוש הנרחב ביותר, הוא רגרסיה לינארית - מודל המאפשר ניבוי של משתנה רציף אחד מתוך משתנה רציף נוסף אחד.
- מבחנים
- מבחן הוא כלי מתמטי המאפשר לבחון הנחות מסוימות לגבי משתנה אחד או לגבי הקשר בין מספר משתנים. קיים מגוון רב של מבחנים, המותאמים לבדיקת הנחות שונות.
ראו גם תורת האמידה.
[עריכה] דוגמאות ליישומים
- מדינות משתמשות בסטטיסטיקה על מנת לאמוד את מספר תושביהן, מצבם, גידולן דמוגרפי וכד', (כחלק מהמגמה הכללית של המדינה המודרנית לבקר את המתרחש בתחומיה על מנת להיטיב לשלוט ולהתערב בו). בישראל עוסקת בכך הלשכה המרכזית לסטטיסטיקה.
- הכלכלה נעזרת בסטטיסטיקה כדי לאפיין מגמות כלכליות.
- המדע נעזר רבות בסטטיסטיקה במחקרים תצפיתיים שונים.
- במדעי החברה נעשה שימוש רב בסטטיסטיקה לצורך מחקר שיטות מחקר כמותיות.
- ארגונים נעזרים בסטטיסטיקה לצורך שיפור ביצועים וקבלת החלטות על-סמך נתונים ועובדות.
[עריכה] קישורים חיצוניים
- ריכוז אתרים סטטיסטיים ברשת, אתר הלשכה המרכזית לסטטיסטיקה