Τροχαία Ατυχήματα στην Ελλάδα 1990-2014: Η Μεθοδολογία
Deprecated: Function create_function() is deprecated in /home/tourismart/public_html/demetriospogkas.com/administrator/components/com_zoo/helpers/renderer.php on line 245
Written by Demetrios Pogkas
on 06 May 2016.

Το θέμα με το οποίο επέλεξα να ασχοληθώ για το τέταρτο data blog μου είναι τα τροχαία ατυχήματα και οι νεκροί που έχουν προκαλέσει. Είχα «ανακαλύψει» τα στατιστικά στοιχεία της Τροχαίας εδώ και αρκετό καιρό στην ιστοσελίδα της Ελληνικής Αστυνομίας, αλλά κατάφερα να ενοποιήσω τα διαφορετικά σετ δεδομένων και να τα επεξεργαστώ μόλις αυτές τις ημέρες. Κύριο έναυσμα για να ασχοληθώ πάλι με αυτή τη διαθέσιμη βάση δεδομένων ήταν η επιστροφή των τροχαίων ατυχημάτων στη δημόσια ατζέντα τον Φεβρουάριο μετά τον αιφνίδιο θάνατο του τραγουδιστή Παντελή Παντελίδη, από εκτροπή του αυτοκινήτου που οδηγούσε.
Η ανάλυση και η οπτικοποίηση των δεδομένων για τα τροχαία ατυχήματα έχει δημοσιευθεί σε άρθρο με τίτλο «Ποιες περιοχές της Ελλάδος μένουν πίσω στη μείωση των τροχαίων» στα guest blogs της Huffington Post Greece. Παρακάτω αναλύω τον τρόπο και τη μεθοδολογία με την οποία εργάστηκα προκειμένου να ενοποιήσω, επεξεργαστώ, αναλύσω και οπτικοποιήσω τις βάσεις δεδομένων.
Οι Βάσεις Δεδομένων
Τα στατιστικά στοιχεία της Τροχαίας για τα τροχαία ατυχήματα και τα θύματά τους βρίσκονται αναρτημένα στην ιστοσελίδα της Ελληνικής Αστυνομίας. Τα δημοσίως διαθέσιμα δεδομένα καλύπτουν κατά την στιγμή συγγραφής αυτού του άρθρου τα έτη 2007 έως και 2014, καθώς και το πρώτο εξάμηνο του 2015.
Τα στοιχεία που καταγράφονται και οι μορφές των αρχείων στις οποίες δημοσιεύονται διαφέρουν από έτος σε έτος, αν και για τα τελευταία χρόνια παρατηρείται μία ενοποιημένη καταγραφή στοιχείων και δημοσίευσης.
Στο έτος 2007 συμπεριλαμβάνεται επιπλέον ένα αρχείο που καταγράφει τα ατυχήματα και τους παθόντες των ετών 1990-2007, ενώ στο έτος 2010 συμπεριλαμβάνεται ένα αρχείο που επικαιροποιεί τα ατυχήματα και τους παθόντες για την 11ετία 2000-2010.
Δεδομένα που Χρησιμοποιήσα (και που Δεν Χρησιμοποίησα)
Για την ανάλυσή μου επέλεξα να χρησιμοποιήσω μόνο τις εξής 9 κατηγορίες δεδομένων:
- Τροχαία Ατυχήματα (Άθροισμα Ελαφρών - Βαρέων - Θανατηφόρων), έτη 1990-2014
- Θανατηφόρα Ατυχήματα, έτη 1990-2014
- Παθόντες Τροχαίων Ατυχημάτων (Άθροισμα Ελαφρώς - Βαρειά Τραυματιών - Νεκρών), έτη 1990-2014
- Νεκροί, έτη 1990-2014
- Τροχαία Ατυχήματα - Θανατηφόρα Ατυχήματα - Παθόντες Τροχαίων - Νεκροί ανά Περιοχή, έτη 2008-2014
- Τύποι Θανατηφόρων Ατυχημάτων, έτη 2010-2014
- Αιτίες Θανατηφόρων Ατυχημάτων, έτη 2010-2014
- Ιδιότητες Παθόντων Θανατηφόρων Ατυχήματων, έτη 2010-2014
- Ηλικίες Παθόντων Θανατηφόρων Ατυχημάτων, έτη 2010-2014
Στα στατιστικά στοιχεία της Τροχαίας καταγράφονται και άλλες ενδιαφέρουσες κατηγορίες δεδομένων (άλλες περισσότερο σποραδικά και άλλες περισσότερο συστηματικά) που στη δική μου ανάλυση επέλεξα να μην χρησιμοποιήσω, όπως για παράδειγμα οι ώρες της ημέρας στις οποίες πραγματοποιούνται τα θανατηφόρα ατυχήματα ή το είδος του οχήματος κοκ.
Δυστυχώς, στα διαθέσιμα στατιστικά στοιχεία, δεν συμπεριλαμβάνονται συστηματικά τα πρωτογενή («ωμά») δεδομένα των τροχαίων ατυχημάτων, τα οποία καταγράφουν αναλυτικά και το σημείο στο οποίο πραγματοποιήθηκε το εκάστοτε ατύχημα. Εάν είχαμε αυτά τα πρωτογενή δεδομένα για ένα σημαντικά μεγάλο και συνεχές διάστημα θα μπορούσαμε να εξάγουμε αρκετές χρήσιμες πληροφορίες, με σημαντικότερη τα σημεία ή τις περιοχές των εθνικών ή αστικών οδικών δικτύων όπου πραγματοποιούνται τα περισσότερα ατυχήματα. Η πληροφορία αυτή θα μπορούσε με τη σειρά της να οδηγήσει σε έρευνα για τα αίτια που προκαλούν τόσο πολλά ατυχήματα σε αυτά τα σημεία ή περιοχές. Από την άλλη, τα στοιχεία που δίδονται διαθέσιμα στην ιστοσελίδα της Ελληνικής Αστυνομίας καταγράφουν τα σημεία τέλεσης των ατυχημάτων ολογράφως και όχι με τη μορφή γεωγραφικού στίγματος, κάτι που όπως και στην περίπτωση των δεδομένων της Πυροσβεστικής για τις δασικές πυρκαγιές, θα δημιουργούσε επιπλέον ανάγκες επεξεργασίας και ανάλυσης.
Ενοποίηση Δεδομένων
Προκειμένου να ενοποιήσω τα πρωτογενή στατιστικά στοιχεία σε ένα αρχείο για να πραγματοποιήσω την προσωπική μου ανάλυση, ξεκίνησα κατ’ αρχάς μετατρέποντας όπου χρειαζόταν τα αρχεία από PDF σε Υπολογιστικά Φύλλα, προκειμένου να καταστούν επεξεργάσιμα.
Για τα στοιχεία συνόλων μέχρι και το 2000 έχουν χρησιμοποιηθεί τα στοιχεία 1990-2007. Για τα στοιχεία συνόλων μέχρι και το 2010 έχουν χρησιμοποιηθεί με μία εξαίρεση τα επικαιροποιημένα στοιχεία 2000-2010.
Για τα στοιχεία συνόλων και τις επιμέρους κατηγορίες από το 2009 μέχρι το 2014 έχουν χρησιμοποιηθεί στην πλειονότητα των εγγραφών τα επικαιροποιημένα στοιχεία κάθε έτους από τα συγκριτικά στοιχεία του επόμενου έτους. Για λίγες περιπτώσεις όπου δεν έχουν δημοσιευθεί ανανεωμένα στοιχεία το επόμενο έτος, χρησιμοποίησα τα προσωρινά στοιχεία του έτους (αυτό έχει συμβεί κυρίως στα στατιστικά που αφορούν την κατανομή σε Γενικές Περιφερειακές Αστυνομικές Διευθύνσεις, εξ ου και οι διαφορές που μπορεί να προκύπτουν στα συνολικά αθροίσματα τροχαίων ατυχημάτων και παθόντων).
Μπορείτε να κατεβάσετε τα ενοποιημένα δεδομένα για τα τροχαία ατυχήματα και τα θύματά τους στην Ελλάδα την περίοδο 1990-2014, προκειμένου να πραγματοποιήσετε τις δικές σας αναλύσεις, πατώντας εδώ (μορφή .xls).
Δείκτης Γενικής Επίδοσης Περιοχής
Ένα σημείο στο οποίο θα πρέπει να σταθώ λίγο περισσότερο, καθώς αποτελεί τον «πυρήνα» ουσιαστικώς της ανάλυσής μου, αλλά και την πρωτότυπη συμβολή μου στην ευρύτερη συζήτηση της θεματικής είναι η αναζήτηση των περιοχών της Ελλάδος με τις καλύτερες και τις χειρότερες επιδόσεις στη μείωση των τροχαίων ατυχημάτων και των θυμάτων τους.
Στόχος είναι να μετρηθεί η μείωση ή αύξηση που εμφανίστηκε σε κάθε γεωγραφική περιοχή της Ελλάδος σε 4 κατηγορίες διαθέσιμων δεδομένων τις οποίες θεώρησα ως τις πιο σημαντικές ως προς την απεικόνιση της επίδοσης μίας γεωγραφικής περιοχής: το σύνολο των τροχαίων ατυχημάτων (άθροισμα, ελαφρών, σοβαρών και θανατηφόρων), το σύνολο των θανατηφόρων ατυχημάτων, το σύνολο των παθόντων (ελαφρά - βαρειά τραυματίες - νεκροί) και το σύνολο των νεκρών.
Κάθε γεωγραφική περιοχή της Ελλάδος έχει αντιστοιχηθεί με την αντίστοιχη διοικητική υποδιαίρεση της Ελληνικής Αστυνομίας, καθώς ταυτίζονται με τις Γενικές Περιφερειακές Αστυνομικές Διευθύνσεις. Μοναδική εξαίρεση είναι η Γενική Αστυνομική Διεύθυνση Θεσσαλονίκης τα στοιχεία της οποίας έχουν αθροισθεί με τα στοιχεία της Γενικής Περιφερειακής Αστυνομικής Διεύθυνσης Κεντρικής Μακεδονίας, τα οποία στην ανάλυσή μου αποτελούν την περιοχή της Κεντρικής Μακεδονίας συνολικά.
Για τη δημιουργία του Δείκτη Γενικής Επίδοσης κάθε περιοχής αθροίζονται οι επιμέρους Δείκτες Επίδοσης κάθε περιοχής για κάθε μία από τις παραπάνω 4 κατηγορίες. Οι Δείκτες Επίδοσης κάθε κατηγορίας υπολογίζονται για κάθε περιοχή ως η διαφορά του σωρευτικού ετήσιου ρυθμού μεταβολής της περιοχής από το σωρευτικό ετήσιο ρυθμό μεταβολής του συνόλου της Επικράτειας. Για τον υπολογισμό του σωρευτικού ετήσιου ρυθμού μεταβολής κάθε κατηγορίας για το σύνολο της Επικράτειας και για κάθε περιοχή ξεχωριστά χρησιμοποιείται ο τύπος υπολογισμού του Σωρευτικού Ετήσιου Ρυθμού Ανάπτυξης (Compound Annual Growth Rate) από τα χρηματοοικονομικά ο οποίος ισούται με: ((τελική τιμή/αρχική τιμή)^(1/έτη))-1.
Έτσι, Δείκτης Γενικής Επίδοσης Περιοχής = Δείκτης Επίδοσης Τροχαίων Περιοχής + Δείκτης Επίδοσης Θανατηφόρων Περιοχής + Δείκτης Επίδοσης Παθόντων Περιοχής + Δείκτης Επίδοσης Νεκρών Περιοχής,
όπου κάθε Δείκτης = Σωρευτικός Ετήσιος Ρυθμός Μεταβολής Επικράτειας - Σωρευτικός Ετήσιος Ρυθμός Μεταβολής Περιοχής,
όπου Σωρευτικός Ετήσιος Ρυθμός Μεταβολής Περιοχής = ((Τελική Τιμή/Αρχική Τιμή)^(1/Έτη))-1.
Για παράδειγμα, για την Αττική, διαμορφώνονται ένας Δείκτης Επίδοσης Τροχαίων Περιοχής -0,00778 [-0,03435 - (-0,02657)], ένας Δείκτης Επίδοσης Θανατηφόρων Περιοχής -0,0035 [-0,08713 - (-0,08363)], ένας Δείκτης Επίδοσης Παθόντων Περιοχής -0,01317 [-0,04032 - (-0,02715)] και ένας Δείκτης Επίδοσης Νεκρών Περιοχής -0,00592 [-0,09 - (-0,08408)]. Οι Δείκτες αθροίζονται σε έναν Γενικό Δείκτη Επίδοσης Περιοχής -0,03037.
Περιοχή (Γενική Περιφερειακή Αστυνομική Διεύθυνση) | ΣΥΝΟΛΟ ΤΡΟΧΑΙΩΝ | ΜΕΣΗ ΕΤΗΣΙΑ ΔΙΑΦΟΡΑ | ΣΥΝΟΛΟ ΘΑΝΑΤΗΦΟΡΩΝ | ΜΕΣΗ ΕΤΗΣΙΑ ΔΙΑΦΟΡΑ | ΣΥΝΟΛΟ ΠΑΘΟΝΤΩΝ | ΜΕΣΗ ΕΤΗΣΙΑ ΔΙΑΦΟΡΑ | ΣΥΝΟΛΟ ΝΕΚΡΩΝ | ΜΕΣΗ ΕΤΗΣΙΑ ΔΙΑΦΟΡΑ |
---|---|---|---|---|---|---|---|---|
ΑΤΤΙΚΗ | 48,875 | -2.66% | 1,848 | -8.36% | 60,547 | -2.72% | 1,946 | -8.41% |
ΣΥΝΟΛΟ | 94,444 | -3.44% | 7,349 | -8.71% | 124,754 | -4.03% | 8,028 | -9.00% |
Οι περιοχές που έχουν μεγαλύτερους σωρευτικούς ετήσιους ρυθμούς μείωσης σε σχέση με το σωρευτικό ετήσιο ρυθμό μείωσης της Επικράτειας σε κάποια κατηγορία εμφανίζουν θετικό Δείκτη Περιοχής για την κατηγορία αυτή (καθώς η διαφορά μεταξύ δύο αρνητικών αριθμών ισούται με πρόσθεση). Οι περιοχές που εμφανίζουν μικρότερους σωρευτικούς ετήσιους ρυθμούς μείωσης σε σχέση με την Επικράτεια ή και σωρευτικούς ετήσιους ρυθμούς αύξησης εμφανίζουν αρνητικό Δείκτη Περιοχής. Όσο μεγαλύτερος αριθμητικά είναι ο Δείκτης Γενικής Επίδοσης Περιοχής τόσο καλύτερη είναι η επίδοση της περιοχής στη μείωση των ατυχημάτων και των παθόντων τους, ενώ όσο μικρότερος αριθμητικά είναι ο Δείκτης Γενικής Επίδοσης Περιοχής τόσο χειρότερη είναι η επίδοσή της.
Θα πρέπει να γίνει ξεκάθαρο ότι ο Δείκτης επιχειρεί να ενοποιήσει ποσοτικά μόνον την επίδοση (μεταβολή στα τροχαία ατυχήματα και στους παθόντες) εντός ορίων μίας γεωγραφικής/διοικητικής περιοχής της Ελλάδος και δεν διερευνά ή λαμβάνει υπόψιν ποιοτικούς παράγοντες, όπως τίνος ήταν η υπαιτιότητα του ατυχήματος, ποιοι παράγοντες συνέβαλαν ή επηρέασαν το ατύχημα, εάν οι παθόντες ήταν κάτοικοι ή περιεθάλπησαν στην εν λόγω περιοχή και ούτω καθεξής, οι οποίοι ενδεχομένως να έδιναν μία διαφορετική «εικόνα».
Οπτικοποίηση
Η οπτικοποίηση των γραφημάτων και του χάρτη έγινε μέσω των JavaScript βιβλιοθηκών Highcharts και Highmaps αντιστοίχως, εκδόσεις των οποίων διατίθενται και δωρεάν.
Πρωτοήλθα σε επαφή με τις δύο αυτές βιβλιοθήκες πριν από λίγους μήνες για ένα άλλο data project, το οποίο εν τέλει δεν βγήκε στον αέρα λόγω μεγέθους και περιορισμένου χρόνου (επιφυλάσσομαι για το εγγύς μέλλον). Το project αυτό, πάντως, με βοήθησε να μάθω να χειρίζομαι τις βασικές λειτουργίες της Highcharts και να επεκταθώ και στην Highmaps.
Πρόκεινται για δύο αρκετά εύκολες βιβλιοθήκες JavaScript, τις οποίες μπορεί να χρησιμοποιήσει ο οποιοσδήποτε δημοσιογράφος ή αναλυτής με βασικές ή αρχάριες γνώσεις γλωσσών προγραμματισμού.
Για όσους θέλουν να δημιουργήσουν έναν δικό τους χάρτη δεδομένων για τις Περιφέρειες της Ελλάδος χρησιμοποιώντας κάποιο δωρεάν εργαλείο, προσωπικώς η Highmaps είναι η καλύτερη βιβλιοθήκη που μπορούν να χρησιμοποιήσουν, καθώς συμπεριλαμβάνει όλες τις 14 (συν την αυτόνομη περιοχή του Αγίου Όρους) διοικητικές υποδιαιρέσεις της χώρας και συμπεριλαμβάνει ορθώς τα νησιά των Κυκλάδων στο Νότιο Αιγαίο Πέλαγος. Αντιθέτως, η βιβλιοθήκη του Tableau συμπεριλαμβάνει τα νησιά των Κυκλάδων στο Βόρειο Αιγαίο Πέλαγος, ενώ δεν σκιαγραφεί σημαντικά νησιά όπως η Μύκονος ή η Πάτμος και άλλα (!). Μία τρίτη επιλογή θα ήταν η χρήση ενός εργαλείου όπως οι Google Fusion Tables με τα KML αρχεία που διαθέτει η πλατφόρμα ανοιχτών γεωχωρικών δεδομένων GeoData.gov.gr και τα οποία είναι εξαιρετικά ακριβή και χρήσιμα.
Όπως ανέφερα παραπάνω, έχω αθροίσει για την ανάλυσή μου τα στοιχεία της Γενικής Αστυνομικής Διεύθυνσης Θεσσαλονίκης με τα στοιχεία της Γενικής Περιφερειακής Αστυνομικής Διεύθυνσης Κεντρικής Μακεδονίας. Ο μόνος ίσως λόγος ήταν το γεγονός ότι, καθώς η Θεσσαλονίκη δεν αποτελεί διοικητική υποδιαίρεση της Ελλάδος, δεν μπορούσα να την απεικονίσω μέσω της Highcharts χωρίς να επενδύσω επιπλέον χρόνο για να κατασκευάσω την περιοχή ευθύνης της Γ.Α.Δ. Θεσσαλονίκης με τη χρήση GeoJSON αρχείων (τα οποία επίσης μπορούν να ανασυρθούν προς επεξεργασία από την GeoData.gov.gr).
Διαβάστε την ανάλυση για τα τροχαία ατυχήματα στο άρθρο με τίτλο «Ποιες περιοχές της Ελλάδος μένουν πίσω στη μείωση των τροχαίων» στα guest blogs της Huffington Post Greece