The Albany Gazette - Apprendre à désapprendre, un défi pour l'IA

Euronext

AEX	-0.22%	873.25	€
BEL20	0.31%	4200.06	€
PX1	-1.4%	7093.97	€
ISEQ	-1.99%	9414.96	€
OSEBX	0.04%	1452.6	kr
PSI20	-0.84%	6361.78	€
ENTEC	-0.41%	1416.23	€
BIOTK	-1.53%	2960.9	€
N150	-0.78%	3252.75	€

Apprendre à désapprendre, un défi pour l'IA

CULTURE 09.12.2023

Apprendre à désapprendre, un défi pour l'IA / Photo: - - OVHcloud/AFP/Archives

Quand Brian Hood a découvert que ChatGPT lui attribuait un passé criminel, ce politicien australien s'est retrouvé face à un casse-tête que des ingénieurs tentent désormais de résoudre: comment apprendre à l'intelligence artificielle (IA) à effacer des erreurs ?

Taille du texte:

Ni la solution légale — en avril, Brian Hood a menacé de porter plainte pour diffamation contre la société OpenAI, à l'origine de ChatGPT — ni le reparamétrage complet des IA ne semble une solution satisfaisante: entraîner à nouveau le modèle s'avérerait particulièrement long et coûteux.

Or, les spécialistes considèrent que le problème du désapprentissage de l'IA sera crucial dans les prochaines années, au regard notamment de la règlementation européenne sur la protection des données (RGPD).

"La capacité à effacer des données au sein de bases d'apprentissage est un sujet majeur", confirme Lisa Given, professeur en sciences de l'information à l'université RMIT de Melbourne. Mais au regard du manque actuel de connaissances sur le fonctionnement des IA, le chemin est encore long, selon elle.

Devant la somme colossale de données sur lesquelles les IA sont entraînées, les ingénieurs cherchent plutôt une solution ciblée afin d'écarter des informations fausses de leur champ de connaissance et d'en arrêter la propagation.

Le sujet a pris de l'ampleur depuis trois à quatre ans, a confirmé à l'AFP le chercheur Meghdad Kurmanji, de l'université britannique de Warwick, expert du domaine.

Google DeepMind, spécialisée dans l'IA, s'est emparée du problème: des experts de la firme américaine ont publié le mois dernier, avec M. Kurmanji, un algorithme destiné à effacer des données au sein d'importants modèles de langage, comme ceux de ChatGPT ou de Bard, le modèle de Google.

- Correction de certains biais -

Et, entre juillet et septembre, plus de 1.000 participants se sont attelés à peaufiner des méthodes de "désapprentissage" des IA dans le cadre d'un concours lancé par l'entreprise américaine.

La méthode employée, commune aux autres recherches en la matière, consiste à introduire un algorithme ordonnant à l'IA de ne pas tenir compte de certaines informations apprises et n'implique pas de modifier la base de données.

Meghdad Kurmanji assure que ce procédé peut être "un outil très intéressant" pour permettre, par exemple, à des outils de recherche de répondre à des demandes de suppression, en conformité avec la protection des données personnelles.

L'algorithme mis au point s'est également montré performant dans la suppression de contenus protégés par des droits d'auteur ou dans la correction de certains biais, assure-t-il.

D'autres, comme le responsable de l'IA au sein de Meta (Facebook, Instagram) Yann LeCun, se montrent plus réticents.

"Je ne dis pas que c'est inutile, sans intérêt ou mauvais, mais je pense qu'il y a d'autres priorités", affirme-t-il à propos de cet algorithme auprès de l'AFP.

Pour Michael Rovatsos, professeur en intelligence artificielle à l'université d'Édimbourg, "la solution technique n'est pas la panacée".

Le "désapprentissage" ne permettrait pas, selon lui, de poser des questions plus larges, comme celle de savoir comment les données sont rassemblées, qui en tire profit ou encore à qui doit incomber la responsabilité des dommages engendrés par l'IA.

Si Brian Hood a vu son problème réglé, sans explication, une fois que son affaire a été suffisamment médiatisée pour corriger automatiquement les données traitées par ChatGPT (qui n'a pas répondu aux sollicitations de l'AFP), il considère que l'heure est encore aux méthodes artisanales.

"Il faut que les utilisateurs vérifient tout, dans les cas où les chatbots écrivent des âneries", affirme l'Australien.

(A.Johnson--TAG)

En vedette

Radio: France Bleu rebaptisée Ici le 6 janvier

Adieu France Bleu, bonjour Ici: le réseau des 44 antennes locales publiques de Radio France changera de nom le 6 janvier, dans le cadre d'un rapprochement initié de longue date avec la télé France 3, ont annoncé ses responsables mercredi.

Netflix, Disney+ et Prime Video ont versé 362 M EUR pour la création française en 2023

Netflix, Disney+ et la plateforme d'Amazon Prime Video ont contribué à hauteur de 362 millions d'euros à la production audiovisuelle et cinématographique française en 2023, en vertu de leurs obligations de financement depuis trois ans, selon un bilan dévoilé par l'Arcom et le CNC mardi.

Le Musée de l'Homme explore l'odyssée humaine des migrations

Une affiche de "The immigrant" de Chaplin, des mappemondes, un gilet de sauvetage, une dent de -54.000 ans: à travers différents objets et en mélangeant les disciplines, le Musée de l'Homme à Paris propose d'aborder avec recul le "brûlant" sujet des migrations.

Dernière passe d'armes au second procès contre Google, axé sur la publicité

Le gouvernement américain et Google ont présenté lundi leurs conclusions en clôture du procès intenté par le ministère de la Justice pour abus de position dominante dans la publicité en ligne, second front judiciaire majeur pour le géant technologique.