The Data Journalism Handbook 1.0
Loading

Η Προπτική της Δημοσιογραφίας Δεδομένων

Το Αύγουστο του 2010, μαζί με κάποιους συνάδελφους στο Ευρωπαϊκό Κέντρο Δημοσιογραφίας (αγγλ. European Journalism Centre) οργανώσαμε ένα από τα πρώτα διεθνή συνέδρια δημοσιογραφίας δεδομένων στο Άμστερνταμ (Ολλανδία). Εκείνη την περίοδο, δεν υπήρχε ακόμα ιδιαίτερο ενδιαφέρον για το θέμα, ενώ και οι οργανισμοί που ήταν γνωστοί για τη δουλειά τους πάνω σε αυτό ήταν πραγματικά λίγοι.

Ο τρόπος που δημοσιογραφικοί οργανισμοί, όπως ο Guardian και οι The New York Times, διαχειρίζονταν τον μεγάλο όγκο δεδομένων που δημοσίευε το WikiLeaks αποτέλεσε ένα από τα σημαντικότερα βήματα για την ευρύτερη προβολή της δημοσιογραφίας δεδομένων σε παγκόσμιο επίπεδο. Την ίδια περίπου χρονική περίοδο, ο όρος αυτός άρχισε να χρησιμοποιείται ευρύτερα (μαζί με τον όρο «δημοσιογραφία με τη βοήθεια ηλεκτρονικών υπολογιστών» ή αγγλ. «computer-assisted reporting») για να περιγράψει το πως οι δημοσιογράφοι χρησιμοποιούν δεδομένα για να βελτιώσουν τις ειδήσεις που παράγουν και να διερευνήσουν εις βάθος ένα συγκεκριμένο θέμα.

Μιλώντας λοιπόν με έμπειρους δημοσιογράφους δεδομένων και ακαδημαϊκούς δημοσιογράφους στο Twitter, αποδείχθηκε ότι ένα από τα πρώτα παραδείγματα αυτού που ονομάζουμε σήμερα δημοσιογραφία δεδομένων έλαβε χώρα το 2006. Αναφέρομαι στην περίπτωση του Adrian Holovaty, ιδρυτή του EveryBlock, μίας ειδησεογραφικής υπηρεσίας που έδινε τη δυνατότητα στους αναγνώστες να βρουν ειδήσεις για το τι συμβαίνει στην περιόχη ή τη γειτονία τους. Στο σύντομο δοκίμιο που δημοσίευσε με τίτλο «Ένας θεμελιώδης τρόπος που οι ειδησεογραφικές ιστοσελίδες πρέπει να αλλάξουν» (αγγλ. «A fundamental way newspaper sites need to change»), υποστηρίζει ότι οι δημοσιογράφοι πρέπει να δημοσιεύουν πέρα από το παραδοσιακό κείμενο για τους αναγνώστες και σωστά δομημένα αρχεία ώστε να διαβάζονται κατευθείαν από υπολογιστές:

«Για παράδειγμα, ας πούμε ότι μία εφημερίδα δημοσιεύει μία είδηση για πυρκαγιά σε κάποια περιοχή. Η δυνατότητα να τη διαβάσει ο αναγνώστης στο κινητό του είναι θεμιτή και ωραία. Μπράβο, αυτό είναι τεχνολογία! Και όμως, αυτό που πραγματικά θα ήθελα προσωπικά να μπορώ να κάνω, είναι να εξερευνώ τα “ακατέργαστα” γεγονότα ένα προς ένα ξέροντας την πηγή του καθενός, αλλά και να υπάρχει η υποδομή ώστε να συγκρίνω τα δεδομένα της συγκεκριμένης πυρκαγιάς με τα αντίστοιχα παλαιότερων περιπτώσεων, όπως ημερομηνία, χρονική στιγμή, τοποθεσία, θύματα, πυροσβεστικό σώμα, απόσταση της πυρκαγιάς από τον πλησιέστερο πυροσβεστικό σταθμό, ονόματα και χρόνια εμπειρίας των πυροσβεστών, πόσο χρόνο πήρε στους πυροσβέστες να φτάσουν στην τοποθεσία της πυρκαγιάς, καθώς και μετέπειτα πυρκαγιές που εκδηλώθηκαν.»

Επομένως, τι ξεχωρίζει τη δημοσιογραφία δεδομένων από άλλες μορφές δημοσιογραφίας που εκμεταλλεύονται τις βάσεις δεδομένων ή χρησιμοποιούν ηλεκτρονικούς υπολογιστές; Πως και σε τι βαθμό η δημοσιογραφία δεδομένων είναι διαφορετική από άλλες μορφές δημοσιογραφίας που εμφανίστηκαν παλαιότερα;

Δημοσιογραφία με Χρήση Υλεκτρονικών Υπολογιστών και Δημοσιογραφία Ακριβείας

Η χρησιμοποίηση δεδομένων για τη βελτίωση ενός ρεπορτάζ και την προετοιμασία σωστά δομημένων πληροφοριών για το κοινό (ή ακόμα και αρχείων που να διαβάζονται απευθείας από υπολογιστές) έχει μακρά ιστορία. Πιθανόν, η πιο σχετική μορφή δημοσιογραφίας (σε αυτό που σήμερα ονομάζουμε δημοσιογραφία δεδομένων) είναι η δημοσιογραφία με χρήση ηλεκτρονικών υπολογιστών (αγγλ. computer-assisted reporting ή CAR εν συντομία) που αποτελεί την πρώτη οργανωμένη και συστηματική προσέγγιση που χρησιμοποιούσε υπολογιστές για να συλλέξει και να αναλύσει δεδομένα για τη βελτίωση των παραγόμενων ειδήσεων.

Η δημοσιογραφία με χρήση ηλεκτρονικών υπολογιστών (από εδώ και πέρα θα αναφέρεται ως CAR) πρωτοχρησιμοποιήθηκε το 1952 από το δίκτυο CBS, σε μία προσπάθεια να προβλέψει την έκβαση των προεδρικών εκλογών στις Η.Π.Α. Έκτοτε, ανεξάρτητοι δημοσιογράφοι-ερευνητές (κυρίως στις Ηνωμένες Πολιτείες) επιδίωκαν να ελέγξουν την εκάστοτε εξουσία αναλύοντας, με επιστημονικές μεθόδους, μεγάλες βάσεις δεδομένων με δημόσια έγγραφα. Γνωστή και ως δημοσιογραφία του δημόσιου τομέα, οι θιασώτες των εν λόγω μεθόδων προσπάθησαν να αποκαλύψουν τάσεις, να απομυθοποιήσουν καθολικά αποδεκτές αντιλήψεις και να δημοσιοποιήσουν αδικίες που πραγματοποιήθηκαν σε συνεργασία δημόσιων αρχών και ιδιωτικών επιχειρήσεων. Για παράδειγμα, ο Philip Meyer προσπάθησε να απομυθοποιήσει τη γενικότερη αντίληψη που δημιουργήθηκε στις εξεργέσεις του 1967 στο Detroit (Η.Π.Α.), ότι όσοι συμμετείχαν ήταν νότιοι με χαμηλό επίπεδο μόρφωσης. Επίσης, η σειρά άρθρων με τίτλο «Το Χρώμα του Χρήματος» (αγγλ. “The Color of Money”) του δημοσιογράφου Bill Dedman, αποκάλυψε τη δεκαετία του ’80 μία συστηματική ρατσιστική αντιμετώπιση μεγάλων τραπεζικών ιδρυμάτων ως προς την πολιτική δανεισμού που ακολουθούσαν. Επιπλέον, στο άρθρο του με τίτλο «Τι Πήγε Λάθος» (αγγλ. “What Went Wrong”), ο Steve Doig επιδίωξε να αναλύσει τα «πρότυπα ζημιών» (αγγλ. damage patterns) που προκλήθηκαν από τον τυφώνα Andrew στις αρχές της δεκαετίας του ’90, ώστε να κατανοήσει τι επιπτώσεις είχαν οι λανθασμένες πολιτικές αστικής ανάπτυξης που εφαρμόστηκαν στο παρελθόν. Με λίγα λόγια, η δημοσιογραφία με χρήση δεδομένων κατάφερε να βοηθήσει την κοινωνία με ουσιαστικό τρόπο και για το λόγο αυτό κέρδισε πλήθος διάσημων δημοσιογραφικών βραβείων.

Στις αρχές της δεκαετίας του ’70, ο όρος δημοσιογραφία ακριβείας χρησιμοποιήθηκε για να περιγράψει το είδος αυτό της συλλογής ειδήσεων: «την εφαρμογή ερευνητικών μεθόδων, από τα πεδία των κοινωνικών και συμπεριφορικών επιστημών, για την άσκηση του επαγγέλματος της δημοσιογραφίας» (από το βιβλίο The New Precision Journalism του Philip Meyer). Μάλιστα, αρκετοί οραματίστηκαν ότι η δημοσιογραφία δεδομένων θα μπορούσε να εφαρμοστεί σε μέσα μαζικής ενημέρωσης με μεγάλη απήχηση, από επαγγελματίες με σπουδές στη δημοσιογραφία και στις κοινωνικές επιστήμες. Ως απάντηση στην ανάγκη για μία «νέα δημοσιογραφία», γεννήθηκε ένα νέο είδος δημοσιογραφίας στο οποίο εφαρμόζονταν τεχνικές φαντασίας (αγγλ. fiction techniques). Ο Philip Meyer πρότεινε ότι αυτό που πραγματικά χρειάζεται η δημοσιογραφία στη διαρκή προσπάθεια της να εντοπίζει την αντικειμενικότητα και την αλήθεια είναι επιστημονικές μεθόδους συλλογής και ανάλυσης δεδομένων.

Μάλιστα, μπορούμε να εκλάβουμε τη δημοσιογραφία δεδομένων ως την αντίδραση του κλάδου απέναντι σε συνηθισμένες τότε ανακρίβειες και αδυναμίες δημοσιογράφων της εποχής, οι οποίοι αναδημοσίευαν θέματα βασιζόμενοι ολοκληρωτικά σχεδόν σε δελτία τύπου και χωρίς να ελέγχουν τις εκάστοτε ειδήσεις (γνωστό και ως churnalism), δείχνοντας άκριτη εμπιστοσύνη σε συγκεκριμένες «έγκυρες πηγές» κ.λπ. Όλα αυτά, σύμφωνα με τον Philip Meyer, ήταν αποτέλεσμα της μη εφαρμογής τεχνικών από την επιστήμη της πληροφορίας, καθώς και μη χρήσης πηγών όπως δημοσκοπήσεις, δημόσια έγγραφα κ.λπ. Η δημοσιογραφία δεδομένων, όπως εξασκούνταν τη δεκαετία του ’60, κατέληξε να αντιπροσωπεί κυρίως περιθωριακές ομάδες προβάλλοντας τη δική τους οπτική. Σύμφωνα με τον Philip Meyer:

H δημοσιογραφία ακριβείας ήταν ένας τρόπος να αυξηθούν τα πιθανά εργαλεία που μπορούσαν να χρησιμοποιήσουν οι δημοσιογράφοι, δίνοντας τους έτσι τη δυνατότητα να καλύψουν θέματα στα οποία παλαιότερα δεν είχαν πρόσβαση (ή η πρόσβαση ήταν εξαιρετικά δύσκολη). Κυρίως όμως, έπαιξε σημαντικότατο κοινωνικό ρόλο δίνοντας τη δυνατότητα σε μειονότητες και περιθωριοποιημένες ομάδες να ακουστούν.

Τη δεκαετία του ’80, δημοσιεύθηκε ένα σημαντικό άρθρο που αφορούσε τη σχέση μεταξύ της δημοσιογραφίας και των κοινωνικών επιστημών, πρόδρομος αν θέλετε της συζήτησης που αναπτύσσεται σήμερα γύρω από τη δημοσιογραφία δεδομένων. Στο εν λόγω άρθρο οι συγγραφείς του, δύο αμερικανοί καθηγητές δημοσιογραφίας, πρότειναν ότι τις δεκαετίες του ’70 και του ’80 παρατηρήθηκε μία μεγάλη αλλαγή ως προς την αντίληψη του κοινού για το τι εστί είδηση: από εκεί δηλαδή που επικρατούσε η στενή αντίληψη ότι οι ειδήσεις παρουσιάζουν απλά τα γεγονότα, σταδιακά περάσαμε στην αντίληψη ότι οι ειδήσεις αναφέρονται πλέον σε κοινωνικές τάσεις – εξελίξεις. Για παράδειγμα, χρησιμοποιώντας βάσεις δεδομένων από απογραφές ή ερωτηματολόγια, οι δημοσιογράφοι είναι πλέον ικανοί να «πάνε πέρα από μία απλή παρουσίαση συγκεκριμένων και μεμονωμένων γεγονότων, εντοπίζοντας πλέον το γενικό πλαίσιο γύρω από τα γεγονότα, το οποίο όμως τους δίνει και νόημα».

Όπως θα περίμενε ο καθένας μας, δεδομένα για τη βελτίωση των παραγόμενων ειδήσεων χρησιμοποιούνταν ανέκαθεν, από την εποχή δηλαδή που πρωτοεμφανίστηκαν τα δεδομένα. Όπως εύστοχα αναφέρει ο Simon Rogers, το πρώτο παράδειγμα δημοσιογραφίας δεδομένων στον Guardian είναι του 1821. Αφορά έναν πίνακα σχολείων του Manchester που διέρρευσε στον τύπο, στον οποίο παρουσιάζονταν ο αριθμός των μαθητών και το συνολικό κόστος ανά σχολείο. Σύμφωνα με τον Rogers, ο εν λόγω πίνακας βοήθησε να παρουσιαστεί ο πραγματικός αριθμός των μαθητών που λάμβαναν δωρεάν εκπαίδευση, ο οποίος ήταν κατά πολύ μεγαλύτερος από ότι τα επίσημα νούμερα έδειχναν.

Figure 9. Δημοσιογραφία δεδομένων στον Guardian, εν έτη 1821 (the Guardian)

Ένα άλλο πρώιμο παράδειγμα στην Ευρώπη προέρχεται από την Florence Nightingale και αφορά το άρθρο της με τίτλο «Θνησιμότητα στον Βρετανικό Στρατό» (αγγλ. “"Mortality of the British Army") που δημοσιεύθηκε το 1858. Στην έκθεση της προς το Κοινοβούλιο, χρησιμοποίησε γραφικές αναπαραστάσεις για να υποστηρίξει την άποψη της για βελτίωση των υπηρεσιών υγείας στον Βρετανικό Στρατό. Η πλέον διάσημη από τις εν λόγω αναπαραστάσεις της ήταν η «coxcomb», όπου παρουσιάζονταν τμηματικά οι θανάτοι ανά μήνα και αποδεικνύονταν έτσι ότι η συντριπτική πλειοψηφία αυτών προέρχονταν από ασθένειες που μπορούσαν να αντιμετωπιστούν και όχι από σφαίρες.

Figure 10. Θνησιμότητα στον Βρετανικό Στρατό, από την Florence Nightingale (εικόνα από την Wikipedia)

Δημοσιογραφία Δεδομένων και Δημοσιογραφία με Χρήση Ηλεκτρονικών Υπολογιστών (CAR)

Την περίοδο αυτή, μία συνεχόμενη και διαρκώς μεταβαλλόμενη συζήτηση μαίνεται γύρω από τον όρο δημοσιογραφία δεδομένων, καθώς και τη σχέση του με παλαιότερες δημοσιογραφικές πρακτικές που χρησιμοποιώντας υπολογιστικές μεθόδους ανέλυαν βάσεις δεδομένων.

Μερικοί υποστηρίζουν ότι υπάρχει διαφορά μεταξύ του CAR και της δημοσιογραφίας δεδομένων, αναφέροντας ότι το CAR αποτελεί μία τεχνική που συλλέγει και αναλύει δεδομένα με στόχο τον εμπλουτισμό ενός ρεπορτάζ. Από την άλλη, η δημοσιογραφία δεδομένων ρίχνει το βάρος της στον τρόπο που όλα αυτά τα δεδομένα «ταιριάζουν» μέσα στο συνολική δημοσιογραφική ροή εργασίας. Υπό αυτή την έννοια, η δημοσιογραφία δεδομένων δίνει το μεγαλύτερο βάρος της στα δεδομένα αυτά καθ’ αυτά και όχι απλά στη χρήση δεδομένων για να βρεις ή να εμπλουτίσεις μία ιστορία. Ως εκ τούτου, βλέπουμε το Guardian Datablog ή την Texas Tribune να δημοσιεύει ολόκληρα σύνολα δεδομένων (αγγλ. datasets) μαζί με άρθρα τους, ή ακόμα και τελείως μόνα τους, δίνοντας τη δυνατότητα σε αναγνώστες να τα αναλύσουν και να τα εξερευνήσουν.

Μία άλλη διαφορά είναι ότι στο παρελθόν, οι δημοσιογράφοι «υπέφεραν» από έλλειψη πληροφοριών γύρω από ένα ερώτημα που προσπαθούσαν να απαντήσουν ή ένα θέμα που επιδίωκαν να καλύψουν. Αν και κάτι τέτοιο ισχύει ακόμα, σήμερα υπάρχει μία διαρκώς αυξανόμενη αφθονία πληροφοριών που οι δημοσιογράφοι δεν ξέρουν απαραίτητα πως να εκμεταλλευτούν. Δεν γνωρίζουν πως να βρουν αξία μέσα στα δεδομένα. Ένα πρόσφατο παράδειγμα είναι το Combined Online Information System, η μεγαλύτερη βάση δεδομένων για δαπάνες στη Μεγάλη Βρετανία. Η δημοσιοποίηση της εν λόγω βάσης δεδομένων ήταν για καιρό στόχος όσων υποστήριζαν τη διαφάνεια, όμως όταν πλέον έγινε προσβάσιμη προκάλεσε αμηχανία σε πολλούς δημοσιογράφους. Όπως πρόσφατα έγραψε ο Philip Meyer: «Όταν οι διαθέσιμες πληροφορίες ήταν λιγοστές, όλες μας οι δυνάμεις εστίαζαν στο να τις κυνηγάμε και να τις συλλέγουμε. Σήμερα που η πληροφορία ρέει σε αφθονία, η ικανότητα να την επεξεργάζεσαι είναι πιο σημαντική».

Από την άλλη βέβαια, ορισμένοι υποστηρίζουν ότι δεν υπάρχει ουσιαστική διαφορά μεταξύ της δημοσιογραφίας δεδομένων και της δημοσιογραφίας με χρήση ηλεκτρονικών υπολογιστών. Είναι πλέον κοινή λογική ότι ακόμα και οι πιο πρόσφατες και καινοτόμες τεχνικές δημοσιογραφίας έχουν ταυτόχρονα και μεγάλη ιστορία πίσω τους, αλλά και κάτι νέο που τις χαρακτηρίζει. Αντί λοιπόν να διαφωνούμε για το αν η δημοσιογραφία δεδομένων αποτελεί κάτι νέο (καινοφανές), μία πιο εποικοδομητική προσέγγιση θα ήταν να την εκλάβουμε ως μέρος μίας μεγάλης παράδοσης, η οποία όμως ταυτόχρονα ανταποκρίνεται στις νέες συνθήκες που επικρατούν. Ακόμα και αν δεν υπάρχει διαφορά στους στόχους και τις τεχνικές που χρησιμοποιούνται, η «γέννηση» του όρου δημοσιογραφία δεδομένων στις αρχές του 21ου αιώνα σηματοδοτεί την είσοδο σε μία νέα εποχή. Μία εποχή όπου ο τεράστιος όγκος δεδομένων που προσφέρεται δωρεάν στο διαδίκτυο –και συνδυάζεται με εξελιγμένα εργαλεία με επίκεντρο τον χρήστη, δυνατότητες αυτοέκδοσης και εργαλεία crowdsourcing– δίνει τη δυνατότητα σε όλο και περισσότερο κόσμο να ασχοληθεί με περισσότερα δεδομένα, πιο εύκολα από ποτέ.

Η Δημοσιογραφία Δεδομένων Συνδέεται Άμεσα με τον Αλφαβητισμό ως προς τη διαχείρηση Μαζικών Δεδομένων

Οι ψηφιακές τεχνολογίες και το διαδίκτυο αλλάζουν εκ θεμελίων τον τρόπο που η πληροφορία δημοσιεύεται. Η δημοσιογραφία δεδομένων αποτελεί ένα μέρος αυτού του οικοσυστήματος από εργαλεία και τεχνικές, τα οποία έχουν «ξεπεδήσει» γύρω από ιστοσελίδες και υπηρεσίες δεδομένων. Η αναδημοσίευση και η προώθηση πηγών σε τρίτους είναι κομμάτι της «φύσης» του Διαδικτύου (το οποίο δομείται με βάση υπερσυνδέσμους – hyperlinks), όπως επίσης κομμάτι αυτής είναι και ο τρόπος που συνηθίζουμε να κατευθύνουμε τις πληροφορίες σήμερα. Πηγαίνοντας ακόμα βαθύτερα, η αρχή που διέπει τη δομή των υπερσυνδέσμων στο Διαδίκτυο είναι η ίδια με την αρχή πίσω από τις παραπομπές και τις πηγές που ακολουθείται στα ακαδημαϊκά έργα. Η παράθεση και η αναφορά σε πηγές και δεδομένα σε κάθε θέμα που δημοσιεύεται, αποτελεί ένα από κυριότερα θετικά που μπορεί να φέρει η δημοσιογραφία δεδομένων στην παραδοσιακή δημοσιογραφία. Αυτό που ονομάζει και ο ιδρυτής του WikiLeaks, Julian Assange, «επιστημονική δημοσιογραφία».

Δίνοντας τη δυνατότητα στον καθένα να ψάξει μόνος του μέσα σε πηγές και δεδομένα για να βρει την πληροφορία που τον ενδιαφέρει (καθώς και να επαληθεύσει ισχυρισμούς και να αμφισβητήσει καθολικά αποδεκτές αντιλήψεις), η δημοσιογραφία δεδομένων καταφέρνει αποτελεσματικά να αντιπροσωπεύσει αυτό που σήμερα αποκαλούμε μαζικός εκδημοκρατισμός των πηγών, των εργαλείων, των τεχνικών και των μεθοδολογιών που μέχρι πρότινος χρησιμοποιούνταν μόνο από ειδικούς (είτε αυτοί ήταν ερευνητές, είτε στατιστικολόγοι, είτε αναλυτές κ.λπ.). Αν και σήμερα η παράθεση και η παραπομπή σε πηγές αποτελεί κομμάτι της δημοσιογραφίας δεδομένων, εντούτοις σταδιακά οδεύουμε προς έναν κόσμο όπου τα δεδομένα θα είναι αρμονικά ενσωματωμένα στον κόσμο των μέσων μαζικής ενημέρωσης. Οι δημοσιογράφοι δεδομένων έχουν να διαδραματίσουν σημαντικότατο ρόλο στην προσπάθεια να υπερκεραστούν τα εμπόδια στην κατανόηση και την αναζήτηση δεδομένων, αυξάνοντας έτσι τον αλφαβητισμό των αναγνωστών τους (ως προς αυτή την κατεύθυνση) σε μαζική κλίμακα.

Αυτή την περίοδο, η εκκολαπτόμενη κοινότητα των ανθρώπων που αποκαλούν τους εαυτούς τους δημοσιογράφους δεδομένων διαχωρίζεται σε μεγάλο βαθμό από την πιο ώριμη κοινότητα του CAR. Ευελπιστούμε στο μέλλον ότι θα δούμε πιο ισχυρούς δεσμούς μεταξύ αυτών των δύο κοινοτήτων, όπως ακριβώς συμβαίνει μεταξύ νέων Μ.Κ.Ο. (όπως η ProPublica και το Bureau of Investigative Journalism) που συνεργάζονται στενά και με επιτυχία με παραδοσιακούς ειδησεογραφικούς οργανισμούς στις έρευνες τους. Ενώ η κοινότητα των δημοσιογράφων δεδομένων κατά πάσα πιθανότητα έχει πιο καινοτόμους τρόπους να παρουσιάζει δεδομένα και ιστορίες – ειδήσεις, η εις βάθος αναλυτική και κριτική προσέγγιση της κοινότητας των CAR είναι κάτι που αδιαμφισβήτητα μπορεί να διδάξει πολλά στη δημοσιογραφία δεδομένων.

Liliana Bounegru, European Journalism Centre