Reliabilität
aus Wikipedia, der freien Enzyklopädie
Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Näheres ist auf der Diskussionsseite angegeben. Hilf bitte mit, ihn zu verbessern, und entferne anschließend diese Markierung. |
Die Reliabilität (Zuverlässigkeit) bezeichnet die formale Genauigkeit wissenschaftlicher Untersuchungen. Reliable wissenschaftliche Ergebnisse sind frei von Zufallsfehlern (Peter/Churchill 1986), d.h. bei Wiederholung eines Experimentes unter gleichen (!) Rahmenbedingungen würde das gleiche Messergebnis erzielt. Reliabilität ist also ein Maß für die Replizierbarkeit der Ergebnisse unter gleichen Bedingungen.
Die Reliabilität stellt neben der Validität und der Objektivität eines der drei wichtigsten Gütekriterien für empirische Untersuchungen dar. Diese bauen aufeinander auf. Ohne Objektivität keine Reliabilität, ohne Reliabilität keine Validität.
Inhaltsverzeichnis |
[Bearbeiten] Retest-Korrelation (Retest-Reliabilität)
Bei der praktischen Umsetzung dieser Vorgaben stößt man auf das Problem, dass der wahre Wert (zum Beispiel die tatsächliche Gedächtnisleistung eines Menschen) nicht ohne weiteres zu quantifizieren ist; alleine schon, weil er Schwankungen unterliegt, aber auch, weil er wiederum gemessen werden müsste, womit man sich in einem Teufelskreis befindet. Die klassische Testtheorie behilft sich mit der Annahme, dass man den wahren Wert einer Person erhalten kann, wenn man mit ihr einen Test unendlich oft wiederholt und die Ergebnisse mittelt. Die Reliabilität eines Experiments wird daher zumeist dadurch gemessen, dass getestet wird, ob man bei der Wiederholung unter gleichen (!) Bedingungen zu denselben Ergebnissen kommt. Die so ermittelte Korrelation zwischen den Messzeitpunkten bezeichnen manche Autoren als Retest-Reliabilität.
In Abweichung der ursprünglichen Definition (Übereinstimmung zwischen dem wahren und dem gemessenen Wert) versteht man in wissenschaftlich-empirischem Kontext unter Reliabilität zumeist jene Retest-Korrelation. Man beachte, dass dabei das jeweils verwendete Messinstrument durchaus immer die gleichen falschen Werte, also einen Messfehler liefern kann. Die so definierte Reliabilität drückt nicht mehr den Zusammenhang zwischen dem wahren und gemessenen Wert aus.
„Unter Reliabilität eines Testes versteht man den Grad der Genauigkeit, mit dem er ein bestimmtes Persönlichkeits- oder Verhaltensmerkmal misst, gleichgültig, ob er dieses Merkmal auch zu messen beansprucht. Der Reliabilitätskoeffizient gibt an, in welchem Maße unter gleichen Bedingungen gewonnene Messwerte über ein und denselben Pbn übereinstimmen, in welchem Maße also das Testergebnis reproduzierbar ist.“ (Lienert, 1989)
[Bearbeiten] Erhebung der Reliabilität
Zur Überprüfung der Reliabilität unterscheidet man zwei verschiedene Methoden:
- Test-Retest-Verfahren: Hier wird geprüft, ob eine Wiederholung der Messung bei Konstanz der zu messenden Eigenschaft die gleichen Messwerte liefert.
- Paralleltestung (Paralleltest-Verfahren): Hier wird geprüft, ob ein vergleichbares Messverfahren identische Ergebnisse liefert. Anstelle gleichwertiger Testverfahren können auch Parallelformen des Tests verwendet werden (zum Beispiel dürften die Aufgaben 3 + 4 = ? und 2 + 5 = ? gleichermaßen dazu geeignet sein, die Fähigkeit zur einfachen Addition zu messen).
Für viele Tests ist eine Wiederholung entsprechend dem Test-Retest-Verfahren nur theoretisch möglich, da die damit einhergehenden Erinnerungseffekte das Ergebnis beeinflussen (zum Beispiel eine mathematische Aufgabe in einem Intelligenztest zweimal lösen). Um in diesen Fällen trotzdem Angaben über die Zuverlässigkeit des Tests machen zu können, werden meist die Items eines Tests aufgeteilt und miteinander korreliert (Split-Half-Reliabilität). Eine sehr gebräuchliche Methode zur Aufteilung der Items ist die Odd-Even-Methode, bei der die Items mit gerader bzw. ungerader Nummer einer Gruppe zugeordnet werden. Da man, mathematisch gesehen, in diesem Fall jedoch eigentlich nur die Reliabilität des „halben“ Tests erhält, muss das ursprüngliche Ergebnis korrigiert werden (Spearman-Brown-Korrektur). Eine weitere Kenngröße für die Reabilität einer Skala ist Cronbachs Alpha. Weitere gängige Werte sind der Übereinstimmungskoeffizient nach Holsti und Cohens Kappa.
[Bearbeiten] Literatur
Peter, J. P.; Churchill Jr., G. A. (1986): Relationships among Research Design Choices and Psychometric Properties of Rating Scales. A Meta-Analysis, in: Journal of Marketing Research, Vol. 23, February, S. 1-10.
Lienert, G. A. (1989): Testaufbau und Testanalyse, (4. Auflage), Weinheim: Psychologie Verlags Union.
[Bearbeiten] Weblinks
Wiktionary: Reliabilität – Bedeutungserklärungen, Wortherkunft, Synonyme und Übersetzungen |
- http://www.uni-leipzig.de/~jenderek/tool/tool.htm (MS-Excel-Makro zur Berechnung verschiedener Reliabilitätskoeffizienten)