Grundlagen medizinischer Statistik

von: Bartholomäus Böhm

Dr. R. Kaden Verlag GmbH & Co. KG, 2017

ISBN: 9783942825528 , 507 Seiten

Format: ePUB

Kopierschutz: Wasserzeichen

Windows PC,Mac OSX geeignet für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Apple iPod touch, iPhone und Android Smartphones

Preis: 14,99 EUR

Mehr zum Inhalt

Grundlagen medizinischer Statistik


 

3. Merkmale und Eigenschaften


Wir beginnen mit etwas ganz Einfachem. Wir betrachten Eigenschaften oder Merkmale von Gegenständen. Was würden wir denken, wenn wir von 0,5 Liter Milch oder 22,7 Katzen sprechen würden? Im ersten Fall wäre es einfach eine Packung Milch, die es in verschiedenen Größen gibt. Milch lässt sich offenbar in verschiedene Mengen abfüllen. Eine Katze ist dagegen eine Katze, wenn sie noch leben sollte. Katzen lassen sich zwar zählen, aber immer nur als Ganzes. Die Rede von 22,7 Katzen ist auf den ersten Blick unverständlich. Es sei denn man versteht sie als statistische Größe im Sinne von „im Durchschnitt besitzen 1000 Einwohner in unserer Stadt 22,7 Katzen“. Niemand würde aber ernsthaft versuchen, die 0,7 Katzen zu suchen oder zu hinterfragen, welche Teile bei der Katze fehlen. Egal, um welche Gegenstände es sich handelt, wir müssen sorgfältig unterscheiden, ob wir die Gegenstände nur als Ganzes zählen oder in beliebige Mengen einteilen können.

Beginnen wir mit einer kleinen Studie. Wir wollen die Haarfarbe der nächsten zehn Menschen in unserer Umgebung bestimmen und teilen sie zunächst in drei Farben ein: Schwarz, brünett und blond. Die erste Schwierigkeit, auf die wir dabei treffen, ist die eindeutige Zuordnung jeder einzelnen Person zu einer dieser drei Haarfarben. Es wird nämlich Haarfarben geben, die wir genau zwischen zwei Gruppen einordnen würden, so dass wir uns nicht  richtig entscheiden können, welcher Gruppe wir sie zuordnen sollen.

Es könnte auch sein, dass die Haarfarben der zehn Personen so verschieden sind, dass wir sie nicht sinnvoll in drei Gruppen einteilen können. Wir könnten uns deshalb darauf verständigen, dass wir die zehn Menschen jeweils einer eigenen Gruppe zuordnen, um allen Unterschieden gerecht zu werden. Wir hätten dann zehn Gruppen mit jeweils einer Person und könnten so zehn Haartönungen definieren, welche wir wiederum nach Helligkeit und Farbe ordnen. Allerdings hätten wir dadurch keine Vereinfachung erreicht. Wir hätten lediglich der Vielfalt Genüge getan.

Führen wir nun denselben Versuch bei den nächsten 100 Personen in unserem Umfeld durch und versuchen wir uns jetzt an die zehn vorherigen Gruppierungen zu halten. Natürlich wird sich bei so vielen Personen die Vielfalt der Haarfarben erweitert haben. Vielleicht bemerken wir zufällig mehr rötliche Töne in einer Untergruppe von jüngeren Menschen, so dass wir uns genötigt sehen, fünf neue Haartöne einführen. Wir verfügen dann über 15 Farben bzw. Haartönungen.

Jemand könnte uns nun darauf hinweisen, dass wir noch zwischen natürlicher und gefärbter Haarfarbe unterscheiden sollten. Da uns aber nur das gegenwärtige Erscheinungsbild interessiert und nicht die angeborene Haarfarbe, belassen wir es bei der tatsächlichen Haarfarbe. Wir berücksichtigen auch keine andersfarbigen Haarsträhnen o.ä. und beziehen uns nur auf den überwiegenden Farbeindruck. Wenn wir tatsächlich alle Details berücksichtigen wollten, dann würden wir im Extremfall wieder bei 100 unterschiedlichen Beschreibungen enden  und hätten dann 

Als wir mit unserer Aufgabe begannen, klang sie relativ einfach. Was sollte daran so schwierig sein, die Personen in unserer Umgebung nach ihrer Haarfarbe in verschiedene Gruppen einzuteilen? Im Laufe des Versuchs traten dann Probleme auf, wie sie in jeder Studie in unterschiedlicher Intensität auftreten. Wir sollten deshalb bei allen Studien darauf achten, durch welche begrifflichen Bestimmungen Gruppen gebildet werden.

Bei unserer Einteilung der Haarfarben schwanken wir zwischen zwei Extremen: Wir wollen einerseits eine möglichst genaue individuelle Haarbeschreibung berücksichtigen und andererseits Individuen mit ähnlicher Haarfarbe zusammenfassen bzw. klassifizieren. Wenn wir aber mehrere Individuen in einer Gruppe zusammenführen, dann müssen wir zwangsläufig auf einige individuelle Details verzichten und diese differenzierten Informationen gehen dabei verloren. Wenn wir mehrere Personen in einer Gruppe mit ähnlicher Haarfarbe zusammenfassen, dann setzt das voraus, dass sich die Farben tatsächlich ähneln. Wie ähnlich sie sein müssen, werden wir festlegen müssen, damit die Einteilung reproduzierbar ist und verschiedene Personen auch zu derselben Einteilung gelangen – natürlich mit einer gewissen Schwankungsbreite. Es ist uns aber bewusst, dass es immer Grenzfälle geben wird, bei denen es schwerfällt, Individuen einer Gruppe zuzuordnen.

Warum wollen wir Individuen überhaupt zu Klassen oder Gruppen zusammenfassen? Warum erfassen wir nicht so viel Individualität wie möglich? Weil wir dann keine Übersicht mehr gewinnen könnten. Um komplexe Daten oder große Datenansammlungen übersichtlich und informativ zusammenzufassen, benötigen wir klassifizierende Begriffe und ein spezielles Instrumentarium. Das mag auf den ersten Blick schwierig erscheinen – ist es aber nicht, oder zumindest nicht immer. Nehmen wir zum Beispiel an, wir hätten tausendmal einen Euro geworfen. Alle Würfe könnten wir sinnvoll zusammenfassen, indem wir sagen, dass wir 532 Mal Kopf geworfen haben. Hätten wir damit alle Informationen über die 1000 Würfe erfasst? Nein, natürlich nicht. Es entgeht uns erstens der gesamte Spaß, den wir dabei gehabt hätten, und wir wüssten auch nicht die genaue Reihenfolge der Zahl-/Kopfwürfe. Es hätten zum Beispiel einige Serien von Kopfwürfen geben können, deren Auftreten sehr unwahrscheinlich gewesen wäre. Wenn wir an diesen Serien interessiert gewesen wären, dann hätten wir uns die Ergebnisse im Detail ansehen müssen. Wenn wir aber nur wissen wollten, wie häufig Kopf geworfen wurde, reicht die Zusammenfassung aus.

3.1 Unterscheidungskriterien


Ein Verlust von Information entsteht immer dann, wenn wir Ergebnisse zusammenfassen und durch neue Werte ersetzen. Wir müssen vorab entscheiden, ob wir an den einzelnen Werten interessiert sind, oder ob uns die Zusammenfassung ausreicht. Und wenn sie uns ausreicht, dann können wir auf die Techniken der deskriptiven (beschreibenden) Statistik zurückgreifen, um auch aussagekräftige und sinnvolle Zusammenfassungen zu kreieren. Letztlich legen unsere Ziele und Interessen fest, welche Art der Zusammenfassung für uns geeignet ist. Dazu können wir ein grobes oder ein feines Raster wählen.

Wir haben in dem obigen Beispiel unterstellt, dass wir uns darauf geeinigt haben, wie wir die unterschiedlichen Haarfarben auswählen. Auch hier mag es Grenzfälle geben, so dass es uns schwerfallen wird, eine Farbe eindeutig und für alle nachvollziehbar zuzuordnen. Häufig verwenden wir in anderen Zusammenstellungen Begriffe wie „klein“ und „groß“, „jung“ und „alt“ oder „hoch“ und „niedrig“, die durch klare Definitionen eingeführt werden müssen, um verständlich zu sein. Eine kleine Maus und ein kleiner Elefant unterscheiden sich maßgeblich voneinander, obwohl sie beide klein sind. Was „jung“ oder „alt“ ist, wird von einem 18jährigen sicherlich anders gesehen als von einem 60jährigen.

Wie sieht es bei komplexen Begriffen wie „Arbeitsloser“ aus? Wann gilt jemand als arbeitslos? Es handelt sich hier um eine moderne soziale Definition, denn Arbeitslose hat es vor einigen Jahrhunderten noch nicht gegeben. Auch in kommunistischen Systemen waren sie nicht existent. Wenn in den Medien über die Zahl der Arbeitslosen berichtet wird, dann sollten wir doch wissen, wer damit gemeint ist. Erinnern wir uns an die Zahlenspiele, die durch die neue Definition der Arbeitslosigkeit seit der Hartz-IV-Reform ausgelöst wurden. Aus annähernd drei Millionen Arbeitslosen wurden über Nacht plötzlich fast fünf Millionen. Solche Begriffe wie „Arbeitslose“ werden heute leichtfertig in den Mund genommen, doch wir sollten auf den korrekten Gebrauch achten. Gegenwärtig definiert das Sozialgesetzbuch III §16: „Arbeitslose sind Personen, die wie beim Anspruch auf Arbeitslosengeld 1. vorübergehend nicht in einem Beschäftigungsverhältnis stehen, 2. eine versicherungspflichtige Beschäftigung suchen und dabei den Vermittlungsbemühungen der Agentur für Arbeit zur Verfügung stehen und 3. sich bei der Agentur für Arbeit arbeitslos gemeldet haben.“ Und wenn uns jemand mitteilt, dass sich die Zahl deutlich erhöht oder erniedrigt habe, dann sollten wir weder jubeln noch verzagen, sondern zunächst nach einer ganz trivialen Änderung in der Begrifflichkeit suchen.

Ein ebenso wichtiges Problem kann auftreten, wenn ein offizielles Klassifikationssystem existiert, an das sich alle halten, und wenn dieses System modifiziert bzw. verbessert wird. Wenn sich die Definition des Arbeitslosen ändert, dann können wir die Zahlen vor und nach der Änderung nicht mehr sinnvoll miteinander vergleichen. In der Medizin werden zum Beispiel bösartige Tumoren nach einem komplexen System eingeteilt, das regelmäßig verbessert wird. Manchmal werden die Einteilungen einzelner Tumore grundlegend neu festgelegt, so dass die beiden Klassifikationen nicht mehr direkt miteinander vergleichbar sind. Die Ergebnisse vor und nach der Änderung können dann nicht mehr miteinander kombiniert werden.

3.2 Häufigkeiten


Welche Möglichkeiten haben wir, die Ergebnisse unserer Haarstudie zu präsentieren?

Abb. 3-1   Befragung von Politikern nach der Wahl des Bundespräsidenten

Wie können wir anderen Personen mitteilen, welche Haarfarben wir bei den 100 untersuchten Personen gefunden haben? Wir könnten die Haarfarben nach einer Tönung sortieren und dann eine vollständige Liste aller Personen aufstellen. Übersichtlich ist das aber nicht, so dass wir deshalb die 15 Tönungen...