Montag, 17. September 2018

Programmansage

Mitte September bin in zur jährlichen Konferenz der britischen Gesellschaft für Bevölkerungsstudien gefahren. Während sie prinzipiell in verschiedenen Orten stattfindet, ist sie alle zwei Jahre an der Universität Winchester. Unter anderem, weil das nah an unserem Büro ist, wo die wichtigsten demografischen Statistiken hergestellt werden. Es macht also Sinn möglichst viele von uns dabei zu haben. Ich war zum dritten Mal da und hatte gleich zwei Vorträge. Einer davon betraf ein Projekt, dass ich seit Ende letzten Jahres halb privat führe und eine Vorstellung wert ist, weil es ein Faktor in meiner Zeitnot ist und einige Frustration mit meiner Arbeit illustriert.

Mein Programm
Als Statistiker mögen wir empirische Beweise. Unter anderem hätten wir gerne konkrete Belege, ob unsere Daten wirklich Einfluss auf Entscheidungen haben, insbesondere in Verwaltung und Politik. Aber während wir jeden Morgen eine Zusammenfassung von Nutzung oder Erwähnung in der Presse erhalten, gibt es nichts vergleichbares für tatsächliche Entscheidungen. Andererseits veröffentlichen die Ministerien und Ämter ihre politischen oder Forschungsberichte auf einer zentralen Webseite. Darin zitieren sie die konkreten Datensätze, die sie benutzen. Ich habe darum ein Programm geschrieben, was diese Berichte öffnet, nach Datensatznamen durchsucht und jeden Treffer zusammen mit dem Namen des Ministeriums, dem Veröffentlichungsdatum und dem Dokumententyp aufzeichnet. Damit kann man verfolgen, ob ein Datensatz benutzt wird, wenn ja von wem, zu welchem Zweck und ob die Nutzung zeitlich zu- oder abnimmt.
Mir wurde für diese Idee etwas Zeit in einem informellen Projekt gegeben, aber den Großteil der Arbeit habe ich zu Hause aus eigenem Interesse gemacht. Das Programm zum Beispiel habe ich vor allem letztes Jahr über Weihnachten geschrieben.
Meine Vorstellung war, dass sowohl unteres als auch oberstes Management das als Leistungsbeweis benutzen können, oder zumindest konkrete Beispiele haben, wofür die Daten nun im Einzelnen benutzt werden. Ich habe aber nur wenig Interesse gesehen. Ein Grund dafür ist vermutlich, dass man auf höheren Stellen weniger Zeit hat, diese Daten auszuwerten. Darum habe ich ein zweites Programm geschrieben, mit dem man im Internet grundlegende Analyse mit ein paar Mausklicks machen kann. Das habe ich auf der Konferenz vorgestellt und dort großes Interesse gefunden. Diese Woche habe ich diese Seite mit Kollegen geteilt.
Da alle Daten öffentlich zugänglich sind, kann sich auch jeder diese Webseite angucken. Oben kann man einen Datensatz auswählen (ich selbst arbeite an den Estimates of the Very Old) und die ersten drei Graphen zeigen dann Nutzung nach Jahren, Veröffentlichungsdatum und Ministerium. Ganz unten kann man umgekehrt ein Ministerium auswählen und dann sehen, welche Datensätze es benutzt.

Ich persönlich vertrete stark die Meinung, dass jeder Analyst heutzutage programmieren können sollte. Außerdem sollten wir alle die diversen kleinen und großen Hilfswerkzeuge kennen, die überall und gratis und in ständig neuer Form verfügbar sind. In den letzten Monaten war ich zunehmend frustriert, weil es so schwierig ist die Zeit zu finden auf dem laufenden zu bleiben, geschweige denn erstmal auf das Laufende zu kommen.

Der Sankt-Katharinen-Hügel
Im Anschluss an die Konferenz konnte ich übrigens noch den Katharinenhügel in Winchester besuchen. Das ist eine prominente Erhebung am Stadtrand, direkt gegenüber des Heiligkreuzspitals, wo ich schon mehrmals gewesen war. Auf einem Besuch im letzten Jahr hatte der Hügel mit seinem kleinen Buchenhain wie ein Steinzeitheiligtum ausgesehen - und in der Tat war es damals eine befestigte Siedlung. Die Normannen bauten später eine Kapelle zwischen diesen Buchen.


Das Heiligkreuzspital vom Hügel aus gesehen.

Keine Kommentare:

Kommentar veröffentlichen