17.14. Erstes Analysebeispiel
Bemerkung
In dieser Lektion werden wir einige echte Analysen ausführen. Wir benutzen die Werkzeugkiste, so dass wir uns noch mehr mit der Verarbeitungsumgebung vertraut machen.
Da jetzt alles richtig konfiguriert ist und wir externe Algorithmen verwenden können, steht uns ein mächtiges Werkzeug zur Durchführung räumlicher Analysen zur Verfügung. Es ist an der Zeit ein echtes Beispiel mit echten Daten zu bearbeiten.
Wir werden den gut bekannten Datensatz verwenden, den John Snow 1854 in seiner wegweisenden Arbeit (https://en.wikipedia.org/wiki/John_Snow_%28physician%29) nutzte und werden zu einigen interessanten Ergebnissen kommen. Die Analyse der Daten ist ziemlich offensichtlich und man benötigt dazu keine anspruchsvollen GIS-Techniken, um zu guten Resultaten und Schlussfolgerungen zu gelangen. Es ist aber eine gute Möglichkeit, zu zeigen, wie man räumliche Fragestellungen mit Hilfe verschiedener Verarbeitungswerkzeuge analysieren und lösen kann.
Der Datensatz enthält shape-Dateien mit den Todesfällen an Cholera und der Lage von Pumpen sowie eine nach OSM gerenderte Karte im TIFF Format. Öffnen Sie das zu dieser Lektion gehörende QGIS Projekt.
Der erste Schritt ist die Erstellung eines Voronoi Diagramms (bzw. Thiessen-Polygone) für den Layer der Pumpen, um die Einflusszone für jede Pumpe zu ermitteln. Der Algorithmus Voronoi-Polygone kann dazu verwendet werden.
Ganz einfach - aber wir erhalten schon erste interessante Informationen.
Die meisten Fälle liegen offensichtlich innerhalb eines der Polygone.
Um ein genaueres Ergebnis zu erhalten, zählen wir die Todesfälle in jedem Polygon. Jeder Punkt steht für ein Gebäude in dem Todesfälle auftraten. Da die Anzahl der Todesfälle in der Attributtabelle gespeichert ist, reicht es nicht, nur die Punkte zu zählen. Wir benötigen eine gewichetete Zählung. Dazu können wir das Werkzeug Punkte in Polygon zählen verwenden.
Das neue Feld wird DEATHS genannt und wir nutzen das Feld COUNT als Wichtungsfeld. Die Ergebnistabelle zeigt eindeutig, dass die Anzahl der Todesfälle im zur ersten Pumpe gehörenden Polygon größer ist, als in den anderen Polygonen.
Ein anderer guter Weg zur Visualisierung der Abhängigkeit jedes Punktes aus dem Layer Cholera_deaths
zu den Punkten im Layer Pumps
ist die Erstellung einer Linie zu der am nächsten gelegenden Pumpe. Dies kann mit Hilfe des Werkzeuges Abstand zum nächsten Knoten (Linie zu Knoten) und der unten aufgeführten Konfiguration erfolgen.
Das Ergebnis sieht wie folgt aus:
Obwohl die Anzahl der Linien zur zentralen Pumpe größer ist, dürfen wir nicht vergessen, dass die Anzahl der Linien nicht der Anzahl der Todesfälle sondern der Anzahl der Orte an denen Todesfälle auftraten, entspricht. Es ist zwar ein repräsentativer Parameter, allerdings ohne Berücksichtigung der mehrfachen Todesfälle an einigen Orten.
Ein Dichtelayer kann das ebenfalls sehr gut verdeutlichen. Wir können ihn mit Hilfe des Algorithmus Heatmap (Kerndichtenschätzung) erstellen. Wenn wir den Layer Cholera_deaths, das COUNT Feld als Wichtungsfeld mit einem Radius von 100 und die Ausdehnung des Rasterlayers der Straßen verwenden, erhalten wir in etwa die folgende Ausgabe.
Denken Sie daran, dass Sie die Ausdehnung der Ausgabe nicht eintippen müssen. Klicken Sie auf die Schaltfläche auf der rechten Seite und wählen Use layer/canvas extent.
Wählen Sie den Rasterlayer der Straßen, seine Ausdehung wird dann automatisch in das Textfeld übernommen. Mit der Zellgröße können wir genauso vorgehen, d.h. wir wählen diesen Layer erneut.
Zusammen mit dem Layer der Pumpen erkennen wir, dass sich eindeutig eine Pumpe im Zentrum der höchsten Dichte der Todesfälle befindet.