Χρεώσεις Νοσοκομείων
Ερευνητές ρεπόρτερς στην CaliforniaWatch έλαβαν υποδείξεις ότι μια μεγάλη αλυσίδα νοσοκομείων στην Καλιφόρνια πιθανά να “πείραζαν” το ομοσπονδιακό πρόγραμμα Υγειονομικής Φροντίδας που πληρώνει τα κόστη υγεινομικής περίθαλψης Αμερικανών ηλικίας 65 ετών και άνω. Η συγκεκριμένη απάτη που αποδόθηκε ως υπερκωδικοποίηση, που σημαίνει ότι οι ασθενείς αναφέρονταν ότι είχαν πιο περίπλοκες συνθήκες – που απαιτούσαν υψηλότερη ασφαλιστική κάλυψη – από ότι είχαν στην πραγματικότητα. Αλλά μια πηγή-κλειδί ήταν μια ένωση που αντιμάχονταν την διαχειριστική αλυσίδα των νοσοκομείων, και η ομάδα της California Watch γνώριζε ότι για να έχει αξιοπιστία η ιστορία ήταν αναγκαία μια ανεξάρτητη επαλήθευση
Ευτυχώς το τμήμα υγείας της Καλιφόρνια έχει δημόσια αρχεία που παρέχουν πολύ λεπτομερείς πληροφορίες για κάθε περίπτωση που έχουν περιθάλψει όλα τα νοσοκομεία της πολιτείας. Οι 128 μεταβλητές περιλαμβάνουν μέχρι 25 διαγνωστικούς κώδικες από τον οδηγό της “Διεθνούς Στατιστικής Κατηγοριοποίησης Ασθενειών και Συναφών Προβλημάτων Υγείας” (κοινώς γνωστό ως ICD-9) που δημοσιεύτηκε από τον Παγκόσμιο Οργανισμό Υγείας. Ενώ οι ασθενείς δεν κατονομάζονται στα δεδομένα, άλλες μεταβλητές αναφέρουν την ηλικία του ασθενούς, πώς πληρώνονται τα κόστη και ποιό νοσοκομείο τους περιέθαλψε. Οι ρεπόρτερς διαπίστωσαν ότι με αυτά τα αρχεία θα μπορούσαν να δούν αν τα νοσοκομεία που ανήκουν στην αλυσίδα ανέφεραν ειδικές ασυνήθιστες συνθήκες σε σημαντικά υψηλότερες τιμές από ότι σε άλλα νοσοκομεία.
Οι σειρές δεδομένων ήταν μεγάλες, σχεδόν 4 εκατομμύρια αρχεία ετησίως. Οι ρεπόρτερς ήθελαν να μελετήσουν αρχεία έξι χρόνων για να δουν πώς μεταβάλλονταν τα μοτίβα με τον χρόνο. Ζήτησαν τα αρχεία από την πολιτειακή αρχή. Αυτά παραδόθηκαν σε CD-ROMs και αντιγράφηκαν εύκολα σε έναν επιτραπέζιο υπολογιστή. Ο ρεπόρτερ που έκανε την ανάλυση δεδομένων στην πράξη, χρησιμοποίησε ένα σύστημα που λέγεται SAS για να δουλέψει τα αρχεία. Το SAS είναι πολύ ισχυρό (επιτρέπει την ανάλυση πολλών εκατομμυρίων αρχείων) και χρησιμοποιείται από πολλές κυβερνητικές αρχές, περιλαμβανομένου και του τμήματος υγείας της Καλιφόρνια, αλλά είναι ακριβό- το ίδιο είδος ανάλυσης θα μπορούσε να γίνει με χρήση μιας γκάμας άλλων εργαλείων ανάλυσης βάσεων δεδομένων, όπως της Microsoft Access ή την MySQL ανοιχτού κώδικα.
Με τα δεδομένα στο χέρι και γραμμένα τα προγράμματα για να τα μελετήσουμε, το να βρούμε ύποπτα μοτίβα ήταν σχετικά εύκολο. Για παράδειγμα, μια κατηγορία ήταν ότι η αλυσίδα ανέφερε λάθος θεραπεία σε πολύ υψηλότερο βαθμό από ότι εμφανιζόταν σε άλλα νοσοκομεία. Χρησιμοποιώντας την SAS, ο αναλυτής δεδομένων εξήγαγε πίνακες συχνότητας που έδειχναν τους αριθμούς των περιπτώσεων λάθους θεραπείας που αναφέρονταν κάθε χρόνο από κάθε ένα από τα άνω των 300 νοσοκομείων εντατικής θεραπείας της Καλιφόρνια. Στη συνέχεια οι πίνακες σειράς συχνοτήτων εισάγονταν στο Microsoft Excel για στενότερη παρακολούθηση των μοτίβων για κάθε ένα νοσοκομείο. Η ικανότητα του Excel να σορτάρει, να φιλτράρει και να υπολογίζει ρυθμούς από τις αριθμοσειρές έκαναν εύκολη την απεικόνιση των μοτίβων.
Εξαιρετικά εντυπωσιακές ήταν οι αναφορές μιας συνθήκης που αποκαλούνταν Kwashiorkor, ένα σύνδρομο πρωτεϊνικής έλλειψης που παρατηρείται σχεδόν αποκλειστικά σε παιδιά που λιμοκτονούν σε υπό ανάπτυξη χώρες που έχουν πληγεί από λιμό. Και όμως η αλυσίδα ανέφερε ότι τα νοσοκομεία της διέγνωθαν Kwashiorkor ανάμεσα σε ηλικιωμένους Καλιφορνέζους σε ρυθμούς σχεδόν πάνω από 70 φορές υψηλότερους από ότι ο πολιτειακός μέσος όρος του συνόλου των νοσοκομείων.
Για άλλες ιστορίες, η ανάλυση χρησιμοποίησε παρόμοιες τεχνικές για να εξετάσει τους αναφερόμενους ρυθμούς για συνθήκες σηψαιμίας, εγκεφαλοπάθειας, κακοήθους υπέρτασης και αυτόνομων νευρικών διαταραχών. Και μια άλλη ανάλυση διερεύνησε κατηγορίες ότι η αλυσίδα υποδεχόταν από τις μονάδες επειγόντων σε νοσοκομειακή περίθαλψη ασυνήθιστα μεγάλα ποσοστά ασθενών Υγειονομικής Φροντίδας, των οποίων η πηγή χρηματοδότησης είναι πιο σίγουρη από ότι πολλών άλλων ασθενών επειγόντων περιστατικών.
Συνοψίζοντας, ιστορίες σαν αυτές γίνονται πιθανές όταν χρησιμοποιείς δεδομένα για να παράγεις αποδείξεις και να ελέγξεις ανεξάρτητα κατηγορίες που απευθύνονται από πηγές που έχουν τη δική τους ατζέντα. Αυτές οι ιστορίες επίσης είναι ένα καλό παράδειγμα της ανάγκης για αυστηρή νομοθεσία δημόσιων αρχείων. Ο λόγος που η κυβέρνηση απαιτεί από τα νοσοκομεία να αναφέρουν αυτά τα δεδομένα είναι για να μπορούν να γίνονται τέτοιες αναλύσεις, είτε από την κυβέρνηση, τους ακαδημαϊκούς, τους ερευνητές ή ακόμη και από πολίτες δημοσιογράφους. Το αντικείμενο αυτών των ιστοριών είναι σημαντικό επειδή εξετάζει αν δαπανώνται σωστά εκατομμύρια δολάρια δημόσιου χρήματος.
— Steve Doig, Walter Cronkite School of Journalism, Arizona State University