Studie

Twitter-Nutzer durch Metadaten identifizierbar

Metadaten sind mit den meisten Informationen, die wir täglich in die digitale Welt schicken, verbunden, allerdings werden diese bislang als unsensibel eingestuft. Das könnte sich jetzt ändern, denn Forscher haben herausgefunden, dass Nutzer durch Tweets mit zielsicherer Genauigkeit identifiziert werden können.

Mit öffentlich zugänglichen Metadaten von Twitter konnte ein maschineller Algorithmus Nutzer anhand ihrer Tweets mit einer Genauigkeit von 96,7 Prozent identifizieren. Das ist das Ergebnis einer aktuellen Studie, die ein Forscherteam rund um Beatrice Perez, Mirco Musolesi und Gianluca Stringhini vom University College London und dem Alan Turing Institute veröffentlicht hat. Demnach übermittelt jeder Nutzer mit jedem Tweet automatisch 144 Datenfelder, die ihn mit Leichtigkeit identifizierbar machen. Selbst die Verschleierung verschiedener Informationen helfe nicht dabei, die Identität zu verbergen.

Für die Untersuchung nahm man einen Korpus von fünf Millionen Twitter-Nutzern und ließ 14 Metadaten aus ihren Tweets (einschließlich der Zeit der Kontoerstellung, der Zeit der Veröffentlichung, der Favoriten- und Followeranzahl, Hashtags, Links oder Retweets) durch drei verschiedene Algorithmen des maschinellen Lernens laufen. Das Ergebnis: Laut der Studie ist der Algorithmus in der Lage, einen Nutzer in einer Gruppe von 10.000 mit einer Genauigkeit von fast 97 Prozent zu identifizieren.

Beatrice Perez, Co-Autorin der Studie, sagte gegenüber Wired, die Leute würden fälschlicherweise davon ausgehen, die Daten seien für eine Identifizierung nicht anfällig. Allerdings würde ja keine vernünftige Person einem völlig Fremden auf der Straße ihre Adresse preisgeben. Womöglich könnte selbige Person die Information, wie oft sie ihr Schlafzimmerlicht ein- und ausschaltet, durchaus preisgeben. Das sei die Mentalität mit den Metadaten, so Perez weiter. „Die Leute denken, es ist keine große Sache. Aber wenn ich diese Informationen mit den Metadaten koppele, weiß ich, wann Sie zu Hause sind oder nicht."

Verschleierungsmethoden sind ineffektiv

Die Tweets, so stellt es die Studie heraus, können mit zielsicherer Genauigkeit zum Nutzer zurückverfolgt werden – egal wie anonym sie auch sein mögen. Die Forscher haben festgestellt, dass Datenverschleierung keinerlei Sinn macht: Die Forscher ließen einige Felder frei, um es dem System zu erschweren, und „anonym“ zu bleiben. Sie mischten 60 Prozent der Metadaten durcheinander, und dennoch konnte der Algorithmus den Urheber des Tweets mit 90-prozentiger Sicherheit identifizieren.

Das Forscherteam glaubt, die Studie könne dazu beitragen, das Bewusstsein für die mit Metadaten verbundenen Datenschutzrisiken zu schärfen. Dabei sei außerdem hervorzuheben, dass sich für die Studie zwar auf Twitter konzentriert wurde, die in der Studie beschriebenen Methoden allerdings auch auf eine große Klasse von Plattformen und Systemen angewendet werden könnten, die Metadaten mit ähnlichen Eigenschaften erzeugen.

Bitte beachten Sie

Die Beiträge in der Rubrik "Trends und Innovationen" sind Inhalte unseres Medienpartners Vogel Communications Group GmbH & Co. KG. Sie spiegeln nicht unbedingt die Meinung von DATEV wider.