Sunday, June 15, 2008

Europäische Mobilfunk-Verkehrsdaten für die Forschung der US-Navy

Die Daten von Mobilfunkbetreibern sind nicht nur für Sicherheitsbehörden interessant, sondern natürlich auch für die Wissenschaft - zum Beispiel für Physiker wie Albert- László Barabási, die sich mit Gesetzmäßigkeiten sozialer Netzwerke beschäftigen. Bewegungsdaten (Verkehrsdaten bzw Standortdaten iSd § 92 Abs 3 Z 6 und 9 TKG 2003) von 6 Millionen Mobilfunkkunden über sechs Monate hindurch hat Barabási mit seinen Mitarbeitern ausgewertet. Ergebnis: es gibt eine signifikante Wahrscheinlichkeit, dass Menschen immer wieder zu einigen wenigen hochfrequentierten Orten zurückkehren (die New York Times fasst das so zusammen: "News flash: we’re boring.", [via Datenschutz-Blog]). Ergebnisse der Studie finden sich in der Zeitschrift nature (ergänzende Informationen dazu), aber auch im Journal of Physics (Warnung: nur für Freunde der Mathematik und Physik). Für das Projekt wurde auch eine Website eingerichtet. Finanziert wurde die Forschungsarbeit vom U.S. Office of Naval Research ("the science and technology provider for the Department of the Navy, advancing the operational concepts and visions for the Navy and Marine Corps of the future"). Die Daten stammen aus Europa:
"This dataset was collected by a European mobile phone carrier for billing and operational purposes. It contains the date, time and coordinates of the phone tower routing the communication for each phone call and text message sent or received by 6 million costumers. ... We used two data sets to explore the mobility pattern of individuals. The first (D1) consisted of the mobility patterns recorded over a six-month period for 100,000 individuals selected randomly from a sample of more than 6 million anonymized mobile phone users. Each time a user initiated or received a call or a text message, the location of the tower routeing the communication was recorded, allowing us to reconstruct the user’s time-resolved trajectory ... we also studied a data set (D2) that captured the location of 206 mobile phone users, recorded every two hours for an entire week."
Die Studie ist wegen der Datenverwendung nicht ganz unumstritten. Die Forscher betonen die Anonymisierung ("To guarantee anonymity, each user is identified with a security key [hash code]."), kamen aber unter Kritik, weil es keine angeblich keine ethics review gab (siehe die Diskussion bei nature). Das Gegenargument der Universität: es ging nicht um Menschen:
"The study relied on a sample from anonymized, aggregate billing data from cell-phone users in an unidentified European country. The Institutional Review Board at the U.S. Office of Naval Research, which funded this study as part of a larger pool of research into human mobility patterns, reviewed the proposal in June 2007 and determined that it did not involve human subjects."
Sind also Handy-Nutzer keine Menschen? Das war wohl doch nicht gemeint. Was aber das unidentifizierte Land betrifft, so dürfte es mit der Anonymisierung nicht allzu weit her sein. Das virtuelle Datenschutzbüro tippt auf Irland oder Italien, die die Vorratsdatenspeicherung schon länger durchführen. Im Hinblick darauf, dass es um einen Betreiber mit mindestens 6 Millionen Kunden geht und (nach den zusätzlichen Informationen) das Land eine Ausdehnung von zumindest 1000 km haben dürfte, kommt Irland aber nicht in Frage. [Über die Verwendung von Verkehrsdaten in Italien hat übrigens Erich Möchel schon einmal abenteuerliche Dinge berichtet (siehe auch hier, Folien 6 bis 8).]

Die Verwendung von Mobilfunk-Verkehrsdaten ist nicht ungewöhnlich. Schon früher haben Mitarbeiter von Barabási auf Verbindungsdaten zurückgegriffen: "Here we use a year’s worth of mobile phone data" schrieben Cesar A. Hidalgo und C. Rodriguez-Sickert in einem Beitrag für Physica über eine frühere Arbeit mit anderen Daten: "The data consist of 7,948,890 voice calls between 1,950,426 users of a service provider holding approximately 25% of an industrialized country’s market." In einer anderen Arbeit von Barabási ua (Zusatzinformationen dazu) heißt es: "A significant portion of a country’s communication network was reconstructed from 18 weeks of all mobile phone call records among 20% of the country’s entire population, 90% of whose inhabitants had a mobile phone subscription"

No comments :