Clavier @20

Deux émissions m’ont récemment fait réfléchir à la notion de travail gratuit pour les Gafa et autres secteurs de recherche en intelligence artificielle. L’une est un podcast de La suite dans les idées, diffusée sur France Culture, intitulée « Une très artificielle intelligence artificielle », l’autre est un entretien filmé du site Hors-série intitulé « Travail gratuit : la nouvelle exploitation ? » Dans les deux émissions, il a été question des Captcha, ces tests qu’utilisent des sites avec des formulaires de recherche ou des procédures de sécurité pour vérifier que l’utilisateur est un humain et non un robot ou une machine, bref un équipement utilisant un programme informatique simulant l’intelligence humaine. Par exemple, il faut indiquer dans une série de photo lesquelles comportent des tigres ou des voitures, plus ou moins faciles à distinguer. C’est aussi un mot difficile à lire en raison de la police de caractère ou parce qu’il est en format image et non texte. La difficulté du test est censée correspondre à ce qu’une machine ne peut pas réussir, donc, par défaut, ce que seul un humain peut arriver à trouver.
Un Captcha est une famille de tests (dits de Turing) permettant donc de distinguer ce qui peut être effectué par un humain et ce qui ne peut (pas encore) être effectué par une machine. Or, ces deux émissions, une sur le versant de la manière dont les informaticiens peuvent « entraîner » un programme à simuler l’intelligence humaine, l’autre sur le travail non rémunéré, évoquent ces tests. « Entraîner » un programme signifie lui permettre d’acquérir de nouvelles données dont il pourra se servir ultérieurement. C’est ainsi qu’un programme de traduction d’une langue à une autre peut étoffer le vocabulaire qu’il utilise ou le contexte d’utilisation de ce vocabulaire en traitant de nouveaux résultats. Je ne prétends pas expliquer scientifiquement les processus, mais la question de l’intelligence artificielle (IA) repose sur l’idée que l’intelligence peut se simuler avec une suite d’algorithmes qui se déroulent logiquement comme une mécanique (IA dite faible) ou peut se stimuler avec la capacité à intégrer des nouveautés et donc d’adapter ces algorithmes pour ne plus simplement dérouler un programme mais le faire évoluer (IA dite forte). C’est schématique mais mon propos n’est pas là.
En utilisant ces Captcha, un site sécurise donc une procédure, mais, ce que j’apprends, est qu’il se sert du résultat pour entraîner des programmes à intégrer de nouvelles données. Chaque fois que je clique sur une image pour répondre à un test, je permets l’association de l’image au mot « tigre » ou au mot « voiture ». Même si cela est assez basique (à cette image, on peut associer une voiture, qu’elle soit en premier plan ou pas, seule ou qu’il y ait en plusieurs, grandes ou petites, etc.), le résultat est utilisé pour valider le test mais aussi pour renforcer « l’apprentissage » de la machine (qui avait déjà ce résultat pour pouvoir distinguer la bonne réponse de la mauvaise). Bref, même si je n’ai pas tous les mécanismes en tête, je retiens qu’il y a moult formes de travail gratuit ainsi récupéré par les sociétés dont nous utilisons les services, parfois gratuitement mais pas toujours. On le savait, rien n’est gratuit sur le Net et, souvent, ceux qui payent sont bien les utilisateurs, par la publicité subie ou par l’utilisation de leurs données, mais s’ouvre ici un moyen non plus seulement passif de « paiement en nature ».
Je vous invite à écouter cette émission sur le travail gratuit, qui ouvre peut-être à plus d’interrogations qu’à des réponses. Ce dont je ne me plains pas tant il est intéressant de pouvoir y réfléchir avec des pistes à creuser plutôt que récupérer des solutions déjà toutes (mal) faites.

 

1 commentaire pour Clavier @20

Envoyer un commentaire

 

 

 

Vous pouvez utiliser ces balises HTML

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>