Privacy Policy Cookie Policy Terms and Conditions Klassifizierung - Wikipedia

Klassifizierung

aus Wikipedia, der freien Enzyklopädie

Klassifizierung oder Klassifikation (von lat. classis, „Klasse“, und facere, „machen“) nennt man das Zusammenfassen von Objekten zu Klassen.

Klassifizierung kommt in nahezu allen Bereichen von Natur und Technik vor. In der Kategorisierung werden Wahrnehmungen klassifiziert; dies ist eine Voraussetzung für Abstraktion und Begriffsbildung und damit letztlich der Intelligenz. Da erst die Klassifizierung realer Informationen geordnete Verarbeitung ermöglicht, ist die Klassifizierung auch zentraler Bestandteil vieler Anwendungen der Informatik. Dort wird die Automatische Klassifizierung als Grundlage der Mustererkennung wissenschaftlich untersucht.

Klassifizierung ist nicht immer einfach: Fehler in der Vorgehensweise und Eigenheiten der einzuordnenden Objekte können zu Fehlentscheidungen führen. Um anzugeben, wie sicher man sich bei einer Zuordnung ist, empfiehlt es sich, jeder Entscheidung eine Angabe über ihre Zuverlässigkeit beizufügen.

Inhaltsverzeichnis

[Bearbeiten] Begriffsabgrenzung

Dieser Abschnitt gibt einen artikelübergreifenden Überblick über die wichtigsten mit der Klassifizierung verbundenen Begriffe.

Die Fachbegriffe der Klassifizierung werden oft ungenau oder sogar falsch verwendet, obwohl die meisten eine klar festgelegte Bedeutung haben. Die sprachliche Verwirrung wird noch dadurch vergrößert, dass manche Konzepte mehrere Namen tragen:

  • Klasse oder Kategorie. Eine Klasse fasst Dinge zusammen, die einer Reihe von Bedingungen genügen. In einer Klasse werden im Allgemeinen Dinge zusammengefasst, die in ihren Merkmalen gleich oder ähnlich sind.
  • Klassengrenzen, Entscheidungsgrenzen. Um zu entscheiden, in welche Klasse ein Objekt gehört, werden zwischen den Klassen Klassengrenzen – seltener auch Entscheidungsgrenzen genannt – gezogen. Ein Objekt gehört zu einer Klasse, wenn es innerhalb ihrer Klassengrenzen liegt.
  • Klassifikation, Klassensystem, Systematik. Die Gesamtheit aller Klassen bildet eine Klassifikation, auch Klassensystem oder Systematik genannt. Häufig verwendete, spezielle Klassifikationen tragen oft eigene Namen: Thesaurus, Ontologie, Verzeichnis, Taxonomie. Die Klassifikation ist das Endprodukt einer Klassifizierung; meist wird jedoch nicht unterschieden und Klassifizierung und Klassifikation gleichbedeutend verwendet.
  • Klassierung. Während bei der Klassifizierung die Klassengrenzen erst erstellt werden, ordnet die Klassierung Objekte in ein bereits bestehendes Klassenystem ein. Die Unterscheidung zwischen Klassierung und Klassifizierung ist rein deutsch, andere Sprachen fassen beide Vorgehensweisen unter dem Begriff Klassifizierung zusammen.
  • Kategorisierung. Klassifizierung und Kategorisierung sind im Grunde genommen dasselbe, unter „Klassifizierung“ fasst man jedoch Mathematik und Technik, unter „Kategorisierung“ Psychologie und Bedeutung zusammen. Kategorisierung kann darüber hinaus das Festlegen der Klassen umfassen.
  • Klassifikator, Klassifizierer. Klassifikator nennt man die Instanz, die eine Klassifizierung oder Klassierung vornimmt.
  • Klassifikationsverfahren. Das Klassifikationsverfahren bestimmt die Vorgehensweise des Klassifikators. Oft wird nicht zwischen Klassifikator und Klassifikationsverfahren unterschieden.

[Bearbeiten] Bedeutung

Klassifizierung ist ein fundamentaler und allgemeingültiger Vorgang, auf dem zahllose komplexere Prozesse aufbauen.

Die Fähigkeit des Klassifizierens gilt als Voraussetzung der Begriffsbildung und damit letztendlich der Intelligenz. Lebewesen klassifizieren ihre Wahrnehmungen in „gefährlich“ und „ungefährlich“ oder „essbar“ und „nicht essbar“, um Wichtiges von Unwichtigem zu unterscheiden. Menschen klassifizieren gehörte Töne zu Worten, gesehene Formen zu Buchstaben und Worten; Klassifizierung ist die Grundlage jedweder Verständigung. Der Artikel Kategorisierung geht näher auf diesen Bedeutungskomplex der Klassifizierung ein.

Automatische Klassifizierung kommt in vielen Techniken zum Einsatz. So bewerten beispielsweise Klassifikatoren Produkte auf Fließbändern als „akzeptabel“ oder „mangelhaft“ oder computertomografische Aufnahmen als „Tumor“ oder „unbedenklich“. Auch für die Künstliche Intelligenz ist Klassifizierung von zentralem Interesse.

[Bearbeiten] Vorgehensweise

Für gewöhnlich setzt sich der Prozess der Klassifizierung aus drei Einzelschritten zusammen:

  1. Klassen vorgeben
  2. Merkmale auswählen
  3. Klassengrenzen ziehen

Typisch für die Klassifizierung ist, dass eine feste Anzahl von Zielklassen vorgegeben wird und es nur noch darauf ankommt, deren Grenzen zu bestimmen. Für die Bestimmung von Anzahl und Art der Klassen ist die Kategoriebildung zuständig.

Die Auswahl aussagekräftiger Merkmale ist für eine erfolgreiche Klassifizierung essentiell, da mit einer steigenden Anzahl von Merkmalen die Anzahl benötigter Beobachtungen exponentiell wächst. In der Praxis ist die Zahl der Beobachtungen aber fest, wodurch, ab einen bestimmten Punkt, die Güte des Klassifikators mit zusätzlichen Merkmalen wieder abnimmt (siehe auch Überanpassung).

Zur Klassifikation ist es daher wichtig, entscheidende Merkmale zu bestimmen. Hierzu werden verschiedene Verfahren eingesetzt:

  • Merkmalsauswahlverfahren

Die Verfahren sind dabei unterschiedlich komplex und liefern je nach Anwendung befriedigende Ergebnisse, unter Umständen muss die Auswahl der Merkmale erneut durchgeführt werden, wenn die Auswahl nicht geeignet getroffen wurde. Auch weniger wichtige Merkmale können dabei, in Zusammenhang mir einigen anderen Merkmalen, für die Klassifikation eine entscheidende Rolle spielen, so dass auch nicht zu wenige Merkmale ausgewählt werden dürfen.

Ebenso entscheidend ist die Wahl des passenden Klassifikationsverfahrens und eines effizienten Klassifikators.

[Bearbeiten] Schwierigkeiten

Folgende Schwierigkeiten können beim Klassifizieren auftreten:

[Bearbeiten] Unsaubere Kriterien

Werden die Bedingungen, wann ein Objekt zu einer Klasse gehört und wann nicht, nicht deutlich vorgegeben, so wird es schwierig bis unmöglich, ein Objekt zu klassieren. Dies passiert im Alltagsgebrauch der Klassifizierung recht häufig: Welche Kriterien unterscheiden gut und böse? Welche Bedingungen unterscheiden Rockmusik von Jazz? Für eine zweifelsfreie Klassifizierung werden klar formulierte und objektiv messbare Kriterien benötigt. Um eine klare Formulierung zu erreichen, wird für gewöhnlich die Mathematik bemüht.

[Bearbeiten] Falsche Merkmale

Es ist nur dann möglich, Objekte in Klassen einzuordnen, wenn die betrachteten Merkmale tatsächlich eine Unterscheidung der Klassen ermöglichen. So ist es beispielsweise nicht möglich, Lebewesen anhand ihrer Haarfarbe in die Klassen Mensch und Affe einzuordnen; die Haarfarbe hat im Allgemeinen keinerlei Aussagekraft über die Klassenzugehörigkeit eines Lebewesens.

[Bearbeiten] Fließende Übergänge

Fließende Übergänge zwischen Klassen widersprechen dem Gedanken der scharfen Klassengrenzen. So sind etwa die Klassengrenzen der Klasse rot im Farbenspektrum sehr schwer festzulegen. Um eine Klassifizierung zu ermöglichen kann eine scharfe Trennlinie künstlich eingeführt werden. Stattdessen kann auch, durch die Verwendung der Fuzzy-Logik, auf diesen unscharfen Mengen operiert und eine scharfe Entscheidung durch die Defuzzifizierung getroffen werden.

[Bearbeiten] Nichttrennbarkeit

Nichttrennbarkeit tritt vor allem auf, wenn zuwenige oder nichtssagende Merkmale betrachtet werden. Die Objekte erscheinen aus diesem Blickwinkel bunt durcheinander gemischt und eine klare Trennung scheint unmöglich. Möchte man etwa anhand der Farbe, der Größe und des Gewichts Äpfel von Orangen unterscheiden, so könnten sich viele Äpfel und Orangen in diesen Merkmalen so ähnlich sein, dass eine eindeutige Trennung nahezu unmöglich ist. Obwohl die Merkmale aussagekräftig gewählt sind, bleibt eine Grauzone, in der die Entscheidung unsicher ist.

[Bearbeiten] Ausreißer

Unvorhersehbare Messfehler oder ungewöhnlich ausgeprägte Einzelexemplare können dazu führen, dass ein Objekt falsch klassifiziert wird.

[Bearbeiten] Vertrauenswürdigkeit einer Entscheidung (Konfidenz)

Selbst wenn alle Merkmale eines Objektes bekannt sind, kann es unter Umständen falsch klassifiziert werden (außer man betrachtet die Klassenzugehörigkeit selbst als Merkmal). So würde man beispielsweise für gewöhnlich eine Haselnuss als ungefährlich klassifizieren, obwohl sie Allergiker töten kann und, aus einer Schleuder geschossen, zu einem gefährlichen Geschoss wird. Andererseits wird nicht jede Röntgenaufnahme korrekt als krank oder nicht-krank klassifiziert, denn unter Umständen lässt der Bildinhalt gar keinen Rückschluss auf die Klassenzugehörigkeit zu. Wird eine Entscheidung erzwungen – und dies ist für gewöhnlich bei der Klassifizierung der Fall – so kann die Einordnung durch solche Effekte fragwürdig bis falsch werden.

Daher geben moderne Klassifizier zusätzlich zu jeder Entscheidung einen Wert aus, der die Vertrauenswürdigkeit (Konfidenz) der getroffenen Entscheidung angibt. Dieses Maß wird gemeinhin Zuverlässigkeitsinformation genannt. Eine große, rote Tomate würde als „reif“ mit hoher Zuverlässigkeit klassifiziert werden, eine mittelgroße rote Tomate mit einigen grünen Stellen ebenfalls als „reif“, jedoch mit niedrigerer Zuverlässigkeit. Die Angabe der Zuverlässigkeit einer Entscheidung bietet Vorteile bei der auf die Klassifizierung folgende Verarbeitung. Ein „unsicher“ als essbar erkannter Pilz wird nicht gegessen, ein „sicher“ als essbar erkannter hingegen schon.

In Szenarien, in denen eine falsche Klassierung schwerwiegendere Nachteile bringt als gar keine, kann es darüber hinaus sinnvoll sein, eine zusätzliche Klasse „nicht klassifizierbar“ einzuführen.

[Bearbeiten] Klassifikationsverfahren

[Bearbeiten] Klassifikationsdarstellungen

Andere Sprachen
THIS WEB:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia 2006:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu