Qu'est-ce que F *** pensait Facebook?

L’année 2013 a été l’une des violations de données les plus médiatisées au monde. Un employé de la cible a cliqué par inadvertance sur un courrier électronique de phishing; Peu de temps après, plus d'un tiers des adultes américains ont été divulgués dans la nature - pour être utilisés d'une manière qui n'avait jamais été prévue lorsque ces adultes ont transmis les données à Target.

Target a été critiqué pour cela. Les gens ont arrêté de magasiner là-bas à Noël. Leur cours des actions a chuté. Leur PDG s'est fait virer.

Aussi mauvais soit-il, c’est un jeu d’enfant comparé à la raquette que Facebook exécutait exactement au même moment.

Il existe une très bonne raison pour que Facebook soit l’activité publicitaire ayant la croissance la plus rapide au monde. C’est parce qu’elle contient les données utilisateur les plus volumineuses, les plus détaillées et les plus granulaires de la planète. C’est aussi incroyablement personnel et révélera beaucoup de choses sur votre vie à tous ceux qui y ont accès. Et pourtant, jusqu'en avril 2015, Facebook donnait toutes ces données à ses développeurs qui utilisaient l'API Graph.

Si vous étiez l'un de ces développeurs et qu'un utilisateur vous donne l'accès à son compte Facebook (par exemple, pour vous connecter ou pour utiliser votre application), vous obtenez un paiement de données qui ne sera probablement jamais reproduit dans l'historique. Ce ne sont pas seulement les données de l'utilisateur, mais toutes les données de ses amis sur Facebook.

En 2014, le nombre médian d'amis par utilisateur sur Facebook était de 200. Il a été largement rapporté que Cambridge Analytica n'avait besoin que de 270 000 utilisateurs pour pouvoir collecter environ 50 millions de données. Cela suggèrerait un ratio de 1 à 185 (ce qui correspond à peu près à ce nombre de 200 amis médians).

Maintenant, en supposant que ce rapport soit linéaire (ce n'est certainement pas dû au fait que certains utilisateurs sont très connectés, d'autres le sont beaucoup moins; il est probable qu'il y ait des «poches» dans les pays et les langues, etc. - mais c'est une hypothèse utile. les maths) combien d'utilisateurs uniques devriez-vous obtenir en tant que développeur, pour que chaque utilisateur de Facebook soit sur la plateforme?

1,5 milliard d'utilisateurs, avec un ratio de 1: 185 = 8 millions de téléchargements. C’est vrai - 8 millions de téléchargements et vous avez toute la plate-forme.

Mais le kicker est que vous n’avez même pas besoin d’avoir réalisé cela.

Facebook a eu la gentillesse d’offrir à chaque utilisateur unique Facebook User_ID lorsqu’il a renvoyé ces demandes de données. Cela signifie que toutes les données de différentes applications, jeux-questionnaires et jeux peuvent être immédiatement et instantanément recombinées dans une base de données volumineuse… tout comme sur Facebook!

Tiré de l'interview de Sandy Parakilas, dénonciateur de Facebook sur Guardian

En d’autres termes, un développeur d’applications n’a même pas eu besoin de créer l’application phare qui a généré 8 millions de téléchargements pour obtenir les profils de l’ensemble de la base utilisateur de Facebook. En fait, il est tout à fait concevable que vous l’ayez tout collecté et que vous utilisiez l’Utilisateur_ID de Facebook comme clé principale pour tout reconstituer (d'où le commentaire de «marché noir» de Parakilas ci-dessus).

Et ne doutons pas du nombre de versions de ces données distribuées par Facebook. Vous souvenez-vous de toutes ces demandes de jeu Facebook ennuyeuses que vous avez reçues de vos amis? Ils ne sont pas juste des notifications agaçantes; ces amis ont également (par inadvertance) divulgué vos données.

Pour vous donner une idée du nombre d’applications disponibles, voici un article d’AdWeek de 2012 citant Facebook et citant 9 millions d’applications et de sites Web intégrés à Facebook. Trois années se sont déjà écoulées en 2012 avant que Facebook n'interrompe l'accès de l'API à ce type de données.

Et pour aggraver encore le problème: de nombreuses startups ont été créées en se basant sur l’accès aux données graphiques. Lorsque Facebook a coupé l'accès à l'API… ces entreprises sont mortes. Cet article de TechCrunch n'en contient que quelques-uns: JobFusion, CareerSonar, Jobs With Friends, adzuna Connect.

Alors que nous craignons que des armes nucléaires ne disparaissent lorsque des États échouent, combien de ces entreprises ou sites Web ont échoué, puis vendu ou «perdu» toutes les données collectées? (Et c’est évident que mettre de côté le fait qu’il est beaucoup plus facile de répliquer des données qu’une ogive nucléaire). Il ne s'agit en aucun cas d'accuser des entreprises susmentionnées d'actes répréhensibles - je ne sais pas ce qu'il est advenu des données lorsqu'elles ont été fermées.

Mais c’est le point: aucun d’entre nous ne le sait. Certainement pas Facebook, car il n’avait «aucune idée» de ce qui se passait.

Je vais m'exprimer et dire que plusieurs entités ont par la suite atteint l'équivalent données de gagner à la loterie: elles ont modifié les profils d'utilisateurs de quelque chose approchant les 100% de personnes sur Facebook au moment où Facebook a finalement tourné v1 de leur API Graph, qui était de retour en avril 2015.

Cela équivaut à environ 1,5 milliard de profils.

Et nous ne parlons évidemment pas uniquement de votre nom et de votre adresse électronique. Pensez au genre de dommage qu'une personne mal intentionnée pourrait vous causer si elle avait tout cela:

Le Motherlode.

Votre nom. Ton emplacement. Tous tes amis Ta famille. Votre histoire de travail. Votre scolarité Ton anniversaire. Vos checkins. Vos événements Votre ville natale. Vos goûts, des photos. Vos relations Votre religion et votre politique

Et pas seulement pour vous, mais pour un milliard et demi d'autres personnes.

La violation de données de Target n’est même pas dans le stade.

Au moins, Target a eu la décence de tenter de protéger ses données utilisateur de ceux qui le souhaitaient, d’une manière qui n’avait jamais été voulue au moment où elles lui ont été données. Facebook n'a même pas dérangé. Ils viennent de le donner.

Mais cela soulève une autre question: pourquoi? Pourquoi diable Facebook a-t-il donné ce qui constitue les joyaux de la couronne pour une entreprise de publicité: les données utilisateur extrêmement précieuses qui permettent aux annonceurs de cibler? Si votre secteur publicitaire connaît la croissance la plus rapide au monde, cela n’a aucun sens.

Je ne crois pas que ce fût une inconscience de l’impact que cela aurait pu avoir, bien que Zuckerberg en ait fait la démonstration au fil des ans.

Je ne pense pas non plus que ce fût une gestion inepte - bien que les gens oublient à quel point Facebook était inepte du point de vue stratégique jusqu'à ce qu'il soit traîné, secoué et hurlant, dans l'ère mobile.

La plus grande raison?

Facebook a longtemps été une entreprise de publicité qui rêvait d'être autre chose qu'une entreprise de publicité. Il voulait être une plate-forme.

Cela est probablement dû en partie au fait que, dans le secteur de la technologie, la publicité est une affaire assez sale. Et une plateforme? C’est l’étalon d’or.

Et si ce sont les grandes illusions que vous avez, ce ne sont pas vos données propriétaires que vous considérez comme le secret de votre succès (que vous devez seulement publier). Au lieu de cela, ce sont les développeurs et les obligeant à s’appuyer sur votre précieuse plate-forme.

C'est ainsi qu'a commencé le grand cadeau de données sur Facebook offert aux développeurs sur cinq ans:

Si vous construisez vos applications sur notre plate-forme, nous vous fournirons plus de données utilisateur que vous ne pouvez en imaginer.

Et c’est ce qui s’est passé. Comme Ben Thompson écrivait sur Stratechery dès 2013, Facebook était tellement concentré sur son rôle de plate-forme que sur son activité de publicité qu'il manquait presque le bateau sur mobile. Le passage à la téléphonie mobile n'a laissé d'autre choix à Facebook que d'abandonner les prétentions de sa plate-forme et a sauvé la société de manière efficace.

Et pourtant, il semble que Facebook n’ait pas entièrement échappé au fantôme de ces faux pas passés. La plainte selon laquelle la publicité est à la base de tant de problèmes auxquels la technologie fait face aujourd’hui n’est pas sans fondement. Ironiquement, ce pourrait être la résistance passée de Facebook à son modèle commercial fondé sur la publicité, qui permet au secteur de la technologie d’atteindre son objectif réglementaire.

C’est facile de regarder Target et de déplorer une entreprise du vieux monde qui n’était pas préparée pour Internet. Facebook, cependant, montre que le problème n’est pas Internet, mais le danger qui vient d’une entreprise qui fonctionne là où elle ne devrait pas. Pour le meilleur ou pour le pire, Facebook est une plateforme publicitaire qui tue: ils ont essayé de ne pas aboutir à un résultat bien pire pour les utilisateurs que la plus grande faille de sécurité de l'histoire.

Si vous avez aimé cela, cliquez sur le ci-dessous pour que les autres le voient ici sur Medium.

Vous pourrez également apprécier Exponent, le podcast coproduit par Ben Thompson et moi-même.

Enfin, si vous souhaitez rester en contact, je suis sur Twitter et j’ai un bulletin électronique qui vous permettra d’être mis à jour de temps à autre.