Das deutsche Gesundheitswesen: Eine Cluster- und Faktorenanalyse der medizinischen Versorgung in Landkreisen und kreisfreien Städten

von: Jens Schröder

Bachelor + Master Publishing, 2013

ISBN: 9783863417369 , 38 Seiten

Format: PDF, OL

Kopierschutz: frei

Windows PC,Mac OSX geeignet für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Online-Lesen für: Windows PC,Mac OSX,Linux

Preis: 19,99 EUR

Mehr zum Inhalt

Das deutsche Gesundheitswesen: Eine Cluster- und Faktorenanalyse der medizinischen Versorgung in Landkreisen und kreisfreien Städten


 

Textprobe: Kapitel 4.1, Clusterstrategie: In der Praxis haben neben den hierarchisch-agglomerativen Verfahren, die partitionierten Verfahren (k-Means) eine große Bedeutung in der Wirtschaftswissenschaft gewonnen. Die hierarchisch-agglomerativen Verfahren neigen zu einer Ein-Clusterlösung und bieten hierzu verschiedene Methoden an. Voraussetzung ist, dass Merkmale metrisch skaliert vorliegen, da hier mit Proximitätsmaßen und/oder Varianzen die Distanzen unter den Objekten berechnet werden. Die partitionierten Verfahren versuchen die Lösungen der hierarchisch-agglomerativen Verfahren, durch die Neuberechnung der Clusterzentren, zu optimieren. Zur Clusteranalyse dieser Arbeit wurde in folgenden Schritten vorgegangen: Zuerst werden mittels Single-Linkage-Verfahren mögliche Ausreißer entdeckt und aus dem Datensatz eliminiert (Kapitel 4.2). Die Single-Linkage-Methode fasst Objekte mit der kleinsten Distanz zusammen. Dadurch, dass es immer den nächstgelegenen Nachbarn zu einem größeren Cluster zusammenführt (Kettenbildung), ist das Verfahren anfällig gegenüber Ausreißern. Das aber wiederum kann durch Beobachten eines sprunghaften Anstiegs des Fusionskoeffizienten dazu genutzt werden, um Ausreißer ausfindig zu machen. Nach dem die Ausreißer eliminiert und die z-Werte neu berechnet wurden, wird im nächsten Schritt das Ward-Verfahren ausgewählt. Das Ward-Verfahren fordert u.a. standardisierte metrisch skalierte, nicht dichotome, Merkmale, da anhand des geringsten Zuwachses des Heterogenitätsmaß, auch Fehlerquadratsumme (SSQ), Objekte oder Cluster, die die Streuung im Cluster am wenigsten erhöhen, zu einem Cluster zusammengeführt werden. Somit bleibt die Streuung innerhalb der Cluster gering (Homogenität) und unter den Clustern groß (Heterogenität). Die Fehlerquadratsumme wiederum beschreibt die Heterogenität der Partition, die sich im Kern aus der Summe der quadratisch euklidischen Abstände zwischen den Objekten bildet, das beim Ward-Verfahren als Distanzmaß gilt. Das Verfahren wird daher zu den Varianz-Methoden gezählt und ist bestrebt, gleich große Cluster zu bilden. Im ersten Schritt des Ward-Verfahrens wird die optimale Partition, also die Anzahl der Cluster, ermittelt (Kapitel 4.3) um im zweiten Schritt die Startpartition und die Clusterzentren für das partitionierte Verfahren (k-Means) zu erzeugen. Als letzter Schritt der Clusteranalyse erfolgt die Erzeugung der finalen Partition mittels k-Means-Verfahren. Das k-Means-Verfahren ist eine partitionierte Methode und zählt zu den iterativen Minimaldistanz-Verfahren, die versucht, die Clusterzentren, die Zentroide in ihrer Lage, (hier gegenüber dem Ward-Verfahren) zu verbessern. Dadurch werden Objekte zwischen den Clustern verschoben, um so die Gesamtgüte einer vorhandenen Clusterlösung, in diesem Fall des Ward-Verfahrens, zu optimieren. Als Gütemaß der Clusterlösungen zählt das eta-quadrat, ein Homogenitätsmaß. Es ergibt sich aus dem erklärten Teil der Gesamtvarianz der Partition zur Gesamtstreuung der Clustermerkmale in einer bestimmten Fusionsstufe und gibt an, zu wie viel Prozentpunkten sich die Streuung der Clusterlösung erklären lässt. 4.2, Ausreißer finden und eliminieren: Ausreißer werden mittels Single-Linkage-Verfahren durch den größten Sprung des Koeffizienten der letzten Fusionsstufen identifiziert, unter Berücksichtigung, dass die zuletzt fusionierten Objekte noch zu keinem weiteren Cluster fusionierten. Werden Ausreißerobjekte gefunden, werden entweder diese mit in die Clusteranalyse inkludiert oder die Objekte werden eliminiert. Bei der Inklusion der Ausreißer besteht die Gefahr, dass Cluster nicht homogen gebildet werden, beziehungsweise sie durch Ausreißer eine ungewollte Gewichtung erhalten. Bei der zweiten Variante müssen die standardisierten Merkmale (z-Werte) wegen der Abhängigkeit zum Mittelwert des Merkmals, neu berechnet werden. In meiner Arbeit werden die Ausreißer eliminiert und somit die z-Werte neu berechnet, um bei der ersten Clusterstufe möglichst homogene Cluster zu bilden. Zum Ergebnis: Die Ausreißer werden mit Hilfe der Fusionstabelle (Tabelle 21 im Anhang C) aus den noch vorhandenen 405 Datensätzen ermittelt und deren Verlauf, übersichtshalber, über die letzten zehn Fusionsstufen mittels Screeplot grafisch dargestellt (Abbildung 1). Als Koeffizient dient hier das quadratisch euklidische Distanzmaß als Unähnlichkeitsmaß, wobei auch das einfache euklidische Distanzmaß hier zum selben Resultat hinsichtlich der Ausreißer führen würde. Eine Identifikation mittels Dendogramm wird wegen dessen ungenauen und normierten Darstellung nicht in Betracht gezogen. In den letzten zehn Fusionsstufen wird der größte Sprung (delta_f) des Koeffizienten (df oder Fusionskoeffizienten) zwischen der 398 und 399 Fusionsstufe (f) beobachtet. Waren hier vorher geringe Sprünge zwischen 0,2 bis 0,4 oder weniger beobachtet worden, wird nun ein Sprung von 1,206 beobachtet, was einen relativen Anstieg zur vorigen Stufe um 16,62 % bedeutet. Die Abbildung macht dieses noch einmal durch den Anstieg des Fusionskoeffizienten der letzten sechs Fusionsstufen (cf) von 6 und weniger deutlich.