The Data Journalism Handbook 1.0
Loading

Αποκτήστε αλφαβητισμό των δεδομένων σε τρία απλά βήματα

Όπως o αλφαβητισμός αναφέρεται «στην ικανότητα να διαβάζουμε για την γνώση, να γράφουμε συνεκτικά και να σκεφτόμαστε κριτικά σχετικά με το τυπωμένο υλικό», o αλφαβητισμός των δεδομένων είναι η ικανότητα να καταναλώνουμε για την γνώση, να παράγουμε με συνοχή και να σκεφτόμαστε με κριτικό πνεύμα για τα δεδομένα. Ο αλφαβητισμός των δεδομένων περιλαμβάνει τον στατιστικό αλφαβητισμό αλλά και την κατανόηση πως δουλεύουμε με μεγάλα σύνολα δεδομένων, πως παράχθηκαν, πως μπορούμε να συνδέσουμε διάφορα σύνολα δεδομένων και πως τα ερμηνεύουμε.

Figure 1. Digging into data (photo by JDHancock)

Το πανεπιστήμιο του Poynter’s News προσφέρει μαθήματα μαθηματικών για δημοσιογράφους στα οποία οι ρεπόρτερ λαμβάνουν υποστήριξη σχετικά με έννοιες όπως οι ποσοστιαίες μεταβολές και οι μέσοι όροι. Ενδιαφέρον είναι το γεγονός ότι αυτές οι έννοιες διδάσκονται ταυτόχρονα δίπλα στα γραφεία του Poynter στα σχολεία της Φλόριντα σε μαθητές της πέμπτης τάξης (ηλικίας 10-11), όπως επιβεβαιώνει το σχολικό πρόγραμμα.

Το γεγονός ότι οι δημοσιογράφοι χρειάζονται βοήθεια σε μαθηματικά θέματα που καλύπτονται πριν το λύκειο δείχνει πόσο οι αίθουσες τύπου απέχουν από τον αλφαβητισμό των δεδομένων. Αυτό αποτελεί πρόβλημα. Πώς μπορεί ένα δημοσιογράφος που ασχολείται με δεδομένα να χρησιμοποιήσει ένα σύνολο δεδομένων για τις καιρικές αλλαγές ένα δεν γνωρίζει τι σημαίνει η τυπική απόκλιση; Πώς μπορεί ένας ρεπόρτερ δεδομένων να γράψει μια ιστορία σχετικά με την κατανομή των εισοδημάτων εάν δεν μπορεί να διακρίνει την διαφορά του μέσου όρου από την ενδιάμεση τιμή;

Ένας ρεπόρτερ σίγουρα δεν χρειάζεται ένα πτυχίο στην στατιστική ώστε να γίνει πιο αποτελεσματικός στην ενασχόλησή του με τα δεδομένα. Όταν αντιμετωπίζει αριθμούς, κάποια μικρά απλά τεχνάσματα μπορούν να τον βοηθήσουν να διηγηθεί καλύτερες ιστορίες. Όπως αναφέρει και ο Gerd Gigerenzer, καθηγητής στο Max Planck Institute, τα καλύτερα εργαλεία δεν οδηγούν σε καλύτερη δημοσιογραφία εάν δεν χρησιμοποιούνται με οξυδέρκεια.

Ακόμα μια αν έχετε έλλειψη γνώσεων στα μαθηματικά ή την στατιστική μπορείτε εύκολα να γίνετε ένα έμπειρος δημοσιογράφος δεδομένων ρωτώντας τρεις απλές ερωτήσεις.

1. Πως συλλέχθηκαν τα δεδομένα;

Εκπληκτική άνοδος του ΑΕΠ

Ο ευκολότερος τρόπος να επιδειχθεί κανείς με εντυπωσιακά δεδομένα είναι να τα κατασκευάσει. Ακούγεται προφανές, όμως τα δεδομένα που σχολιάζονται συχνά ως γραφήματα του ΑΕΠ μπορεί να είναι ψευδή. Ένας προηγούμενος βρετανός πρέσβης, ο Craig Murray αναφέρει στο βιβλίο του, Murder in Samarkand, ότι οι ρυθμοί ανάπτυξης στο Ουζμπεκιστάν υπόκεινται σε έντονες διαπραγματεύσεις μεταξύ της τοπικής κυβέρνησης και των διεθνών φορέων. Με άλλα λόγια , δεν σχετίζεται καθόλου με την τοπική κοινωνία.

Το ΑΕΠ χρησιμοποιείται ως ο νούμερο ένα δείκτης επειδή οι κυβερνήσεις τον χρειάζονται ώστε να ελέγχουν την κύρια πηγή εσόδων τους το ΦΠΑ. Όταν μια κυβέρνηση δεν χρηματοδοτείται από το ΦΠΑ ή όταν δεν δημοσιοποιεί τον προϋπολογισμό του, δεν έχει λόγο να συλλέγει δεδομένα που σχετίζονται με το ΑΕΠ και είναι καλύτερο για αυτήν να τα κατασκευάζει.

Η εγκληματικότητα βρίσκεται πάντα σε άνοδο

«Η εγκληματικότητα στην Ισπανία αυξήθηκε κατά 3%» γράφει το El Pais. Οι Βρυξέλλες θίγονται από την αυξημένη εγκληματικότητα από παράνομους μετανάστες και ναρκομανείς αναφέρει το RTL. Αυτός ο τύπος αναφοράς είναι κοινός και βασίζεται στις στατιστικές της αστυνομίας αλλά δεν μας λέει πολλά για την βία.

Μπορούμε να εμπιστευόμαστε το γεγονός ότι μέσα στην Ευρωπαϊκή ένωση τα δεδομένα δεν αλλοιώνονται. Αλλά το προσωπικό της αστυνομίας ανταποκρίνεται σε κίνητρα. Όταν η υπόθεση σχετίζεται με ποσοστό διαλεύκανσης για παράδειγμα οι αστυνομικοί έχουν κίνητρο να αναφέρονται όσο το δυνατόν περισσότερο σε περιστατικά που δεν απαιτούν διερεύνηση. Ένα τέτοιο έγκλημα είναι το κάπνισα ναρκωτικών. Αυτό εξηγεί γιατί η εγκληματικότητα που σχετίζεται με ναρκωτικά στην Γαλλία αυξήθηκαν στα τετραπλάσιο τα τελευταία χρόνια ενώ η κατανάλωση παρέμεινε η ίδια.

Τι μπορείτε να κάνετε

Όταν η αξιοπιστία ενός αριθμού είναι αμφίβολη, πάντα πρέπει να ελέγχετε διπλά, όπως στην περίπτωση ενός αποσπάσματος από πολιτικό. Στην περίπτωση του Ουζμπεκιστάν, ένα τηλεφώνημα σε κάποιον που έχει ζήσει εκεί κάποιον καιρό αρκεί («Αισθάνεστε ότι η χώρα είναι κατά τρεις φορές πιο πλούσια όπως δείχνουν τα επίσημα στοιχεία;»)

Για τα δεδομένα της αστυνομίας, οι κοινωνιολόγοι συχνά πραγματοποιούν μελέτες θυματοποίησης ρωτώντας τους ανθρώπους εάν υπόκεινται στο έγκλημα. Αυτές οι μελέτες είναι περισσότερο σταθερές από ότι τα δεδομένα της αστυνομίας. Ίσως γι αυτό δεν αποτελούν πρωτοσέλιδα.

Άλλα τεστ σας επιτρέπουν να αξιολογείτε με ακρίβεια την αξιοπιστία των δεδομένων, όπως ο νόμος του Benford, αλλά τίποτα δεν μπορεί να αντικαταστήσει την δική σας κριτική σκέψη.

2. Τι υπάρχει εκεί για να μάθουμε;

Ο κίνδυνος πολλαπλής σκλήρυνσης διπλασιάζεται όταν δουλεύουμε το βράδυ

Σίγουρα κάθε γερμανός που έχει τα λογικά του θα σταματήσει να εργάζεται βραδινές βάρδιες ύστερα από αυτό το πρωτοσέλιδο. Αλλά το άρθρο δεν αναφέρει ποιος είναι ο κίνδυνος πραγματικά.

Πάρτε 1.000 γερμανούς. Ένας από αυτούς θα αποκτήσει πολλαπλή σκλήρυνση κατά την διάρκεια της ζωής του. Τώρα εάν κάθε ένας από αυτούς τους 1.000 γερμανούς δουλεύει σε βραδινή βάρδια ο αριθμός αυτών που υπάρχουν από πολλαπλή σκλήρυνση ανεβαίνει στο δυο. Ο επιπρόσθετος κίνδυνος να αποκτήσει κάποιος πολλαπλή σκλήρυνση σε βραδινές βάρδιες είναι 1 προς 1.000, όχι 100%. Σίγουρα αυτή η πληροφορία είναι πιο χρήσιμη για κάποιον που σκέφτεται να πάρει την δουλειά.

Κατά μέσο όρο, 1 στους 15 ευρωπαίους είναι τελείως αναλφάβητος

Το παραπάνω πρωτοσέλιδο φαίνεται τρομαχτικό. Επίσης είναι απολύτως αληθές. Ανάμεσα στα 500 εκατομμύρια ευρωπαίους, τα 36 εκατομμύρια πιθανόν δεν ξέρουν να διαβάζουν. Επιπλέον, 36 εκατομμύρια είναι κάτω των 7 ετών (δεδομένα από Eurostat,http://bit.ly/eurostat-numeracy).

Όταν γράφουμε για τον μέσο όρο, πρέπει να αναρωτιόμαστε «ο μέσος όρος από τι;» Είναι ο πληθυσμός αναφοράς ομογενής; Άνισα πρότυπα κατανομών εξηγούν γιατί οι περισσότεροι άνθρωποι τα καταφέρνουν καλύτερα από τον μέσο όρο για παράδειγμα. Στους περισσότερους ανθρώπους έχει συμβεί μηδέν ή ένα ατύχημα κατά την διάρκεια της ζωής τους. Λίγοι απρόσεκτοι οδηγοί έχουν πολλά περισσότερα, ωθώντας το μέσο όρο των ατυχημάτων πολύ υψηλότερα από αυτό που έχουν οι περισσότεροι άνθρωποι. Το ίδιο συμβαίνει και με την κατανομή των εισοδημάτων: οι περισσότεροι άνθρωποι κερδίζουν λιγότερο από τον μέσο όρο.

Τι μπορείς να κάνεις

Πάντα να λαμβάνετε υπόψην την κατανομή και το βασικό ποσοστό. Ο έλεγχος του μέσου όρου και της μεσαίας τιμής καθώς και της επικρατούσαν τιμής (η πιο συχνή τιμή στην κατανομή) μας βοηθά να αποκτούμε γνώση των δεδομένων. Γνωρίζοντας την τάξη μεγέθους βοηθά στην παροχή πλαισίου όπως στο παράδειγμα με την πολλαπλή σκλήρυνση. Τέλος η αναφορά σε συχνότητες (1 στα 100) είναι ευκολότερο στην κατανόηση από τα ποσοστά (1%).

3. Πόσο αξιόπιστη είναι η πληροφορία

Το πρόβλημα του μεγέθους του δείγματος

«Το 80% δεν είναι ευχαριστημένοι με το σύστημα δικαιοσύνης» αναφέρει μια έρευνα στη Σαραγόσα στο Diaro de Navarra. Πως μπορεί κανείς να βγάλει συμπεράσματα από 800 ερωτηθέντες για τα 46 εκατομμύρια των Ισπανών; Κάτι τέτοιο δεν μπορεί να είναι έγκυρο.

Όταν ερευνάτε έναν μεγάλο πληθυσμό (πάνω από μερικες χιλιάδες), συνήθως δεν χρειάζεστε πάνω από χίλιους ερωτηθέντες ώστε να έχετε ποσοστό σφάλματος μικρότερο από 3%. Αυτό σημαίνει ότι εάν ξανακάνατε την έρευνα με τελείως διαφορετικό δείγμα, 19 φορές από τις 20 οι απαντήσεις που θα παίρνατε θα ήταν σε διάστημα μεταξύ τριών ποσοστιαίων μονάδων από την τιμή που θα είχατε λάβει ένα ρωτούσατε κάθε άτομο.

Το τσάι μειώνει την πιθανότητα εγκεφαλικού

Άρθρα για τις ευεργετικές ιδιότητες του τσαγιού είναι συνήθη. H αναφορά της Die Welt ότι το τσάι μειώνει τον κίνδυνο εμφράγματος μου μυοκαρδίου δεν αποτελεί εξαίρεση. Παρόλου που οι επιπτώσεις του τσαγιού μελετούνται από επιστήμονες, πολλές έρευνες δεν λαμβάνουν υπόψη τον τρόπο ζωής, όπως η δίαιτα, το επάγγελμα ή η ενασχόληση με τον αθλητισμό.

Στις περισσότερες χώρες, το τσάι αποτελεί αναψυκτικό για την υψηλή τάξη που είναι ενημερωμένη σχετικά με θέματα υγείας. Σε περίπτωση που οι ερευνητές δεν ελέγχουν τον τρόπο ζωής των υποκειμένων στις μελέτες για το τσάι, το μόνο που μπορούν να εξάγουν είναι ότι οι «πλούσιοι είναι πιο υγιείς και πιθανόν πίνουν τσάι».

Τι μπορείτε να κάνετε

Τα μαθηματικά πίσω από τις συσχετίσεις και τα περιθώρια λαθών είναι σωστά χωρίς αμφιβολία τις περισσότερες φορές. Όμως εάν οι ερευνητές δεν εξετάζουν τις συν-συσχετίσεις (αυτοί που πίνουν τσάι ασχολούνται με τον αθλητισμό), τα αποτελέσματα τους δεν έχουν αξία.

Όντως δημοσιογράφος, δεν έχει νόημα να αμφισβητείτε τα αριθμητικά αποτελέσματα της μελέτης, όπως το δείγμα του πληθυσμού, εκτός εάν υπάρχουν σοβαρές αμφιβολίες. Παρόλα αυτά, είναι εύκολο να διαπιστώσει κάποιος εάν οι δημοσιογράφοι έχουν λάβει υπόψη τους όλες τις σχετικές πληροφορίες.

Nicolas Kayser-Bril, Journalism++