TheCricLinks

Je me pose plein de questions, Internet est un moyen d'y répondre

Nom :

La devise de la France est Liberté - Égalité - Fraternité. Cette devise peut et doit nous aider à trouver le bon chemin.

lundi 21 août 2006

Big Brother - 'AOL Gate' Data Mirrors - Search Query Data Scandal by Elliott Back - Le Scandale de l'AOL Gate

A complete and original queries archive text from 650,000 AOL users is circulating on the web.

You can get the AOL archive from the web [here !] or from peer to peer network like eDonkey network [AOL-data.tgz here !]. You even find a web site to query the AOL archive [here !]


If you are on AOL you could be afraid. If you are on AOL but not afraid, read first AOL Gate Search Query Data Scandal.

This archive was originally released by AOL to be used by researchers working on search engine, AOL realized soon they have done a big mistake because the data of the file can be reorganized to get some users profiles back :
This collection consists of ~20M web queries collected from ~650k users over three months.
The data is sorted by anonymous user ID and sequentially arranged.
The goal of this collection is to provide real query log data that is based on real users. It could be used for personalization, query reformulation or other types of search research.

The data set includes {AnonID, Query, QueryTime, ItemRank, ClickURL} :
  • AnonID - an anonymous user ID number.
  • Query - the query issued by the user, case shifted with most punctuation removed.
  • QueryTime - the time at which the query was submitted for search.
  • ItemRank - if the user clicked on a search result, the rank of the item on which they clicked is listed.
  • ClickURL - if the user clicked on a search result, the domain portion of the URL in the clicked result is listed.

AOL has fired its CTO Maureen Govern which arrived in the company one year ago

Wired on the same subject : Privacy debacle Hall of fame
______________________________

Big Brother AOL is Watching You

Ce 8 aout, AOL a laissé à libre disposition en téléchargement un fichier de 20 millions de requêtes Web envoyés par 650.000 de ses utilisateurs pendant trois mois.

Ce fichier, originellement à destination des chercheurs dans le domaine des moteurs de recherche, est apparu comme étant un danger en soi pour les utilisateurs d'AOL car même si les noms des usagers ne sont pas apparents, on peut en croisant les requêtes posées par un même usager parfois faire resortir le profil de l'usager voire l'identifier.

AOL a très vite réalisé sa (grosse) boulette et retiré le lien de téléchargement mais
ce fichier est maintenant disponible sur le web (voir plus haut) et on commence à avoir apparaître des méthodes d'extractions d'informations privées de ce fichier (voir les liens au-dessus).

.... AOL a renvoyé sa directrice technique Maureen Govern... A suivre...

J'ai été plus rapide que l'AFP/ Le Monde.fr sur ce coup là
qui titre Une directrice limogée après une publication de données accidentelle. Comme si il ne s'agissait que de ça.... pssss ces journalistes ;-)...

15:29 22/08/2006 et plus rapide que Wired

Libellés : ,