Partager

5 min
5 min

Comment ChatGPT et les IA génératives bousculent déjà l'administration

En juin, le gouvernement annonçait le lancement à la rentrée d'une expérimentation de ChatGPT et autres IA génératives de textes pour répondre aux questions des usagers sur ServicesPublics+. Mais dans les ministères, les services fourmillent déjà d’idées pour utiliser ces outils dans le cadre de leurs missions. Et ce bien avant l’irruption de ChatGPT fin 2022.

Utiliser ChatGPT pour préparer les réponses aux usagers ? C’est l’ambition portée par le ministre de la Transformation et de la Fonction publiques, Stanislas Guerini. Ce dernier a annoncé le lancement d’une expérimentation à la rentrée pour aider les agents à mieux répondre aux questions posées par les usagers sur la plate-forme ServicesPublics+, et pour laquelle 1 000 agents se sont déjà portés volontaires. Une expérimentation tout ce qu’il y a de plus officiel, mais loin d’être la seule dans le secteur public, où l’on assiste, comme partout ailleurs à une certaine effervescence pour ces “grands modèles de langage”, ou LLM, l'appellation générique des technologies sous-jacentes aux IA génératives de textes. “Dans les couloirs, ou à la cantine, on entend beaucoup d’agents faire part de leurs explorations autour de ChatGPT, pour rédiger des notes”, illustrait une agente juste après l’annonce de l’expérimentation par Stanislas Guerini. “Cela intéresse évidemment beaucoup, car tout le monde veut s’approprier cette technologie et en identifier les limites et le potentiel”, confie un responsable d’incubateur ministériel.

Un premier terrain d’exploration qui a le mérite d’être praticable, et surtout de ne pas risquer de voir des données sensibles ingurgitées par OpenAI, la société mère de ChatGPT. C’est d’ailleurs la règle principale guidant les explorations à Bercy. “Rien de confidentiel ni de sensible ne doit être porté en prompt [le texte de la requête transmise à la machine, ndlr] dans une IA générative”, explique Guillaume Coldre, qui rappelle ensuite que les “IA génératives généralistes peuvent apporter des réponse erronées : elles sont plus vues comme une base d’aide au raisonnement que comme une base de connaissance”. De nombreuses explorations ont d’ores et déjà été lancées, principalement pour les besoins des informaticiens eux-mêmes, comme la détection et la résolution automatique de bugs dans les codes informatiques complexes à la direction générale de la concurrence, de la consommation et de la répression des fraudes (DGCCRF). Mais aussi pour rédiger des fiches ou des offres d’emplois ou pour automatiser le support utilisateurs, toujours à la DGCCRF. D’autres pistes sont envisagées, pour aider la direction générale des finances publiques (DGFIP) à vérifier la complétude d’un dossier, ou bien encore pour catégoriser les amendements concernant les Impôts et aider à les aiguiller vers le bon service. Tout cela “sans passage à l’échelle à ce stade”, et sans “contrevenir à la protection des données”, précise Guillaume Coldre.

Cette nécessité de garder la main sur les données explique la préférence, partout dans les administrations, pour des modèles de langage ouverts dont on peut soulever le capot, et donc en analyser les rouages. C’est l’approche également privilégiée par l’équipe en charge de l’expérimentation avec ServicesPublics+. “L’idée est d'entraîner plusieurs modèles existants pour préparer des pré-réponses aux administrés, sans mettre le chatbot directement au contact de l’usager, et de comparer ces modèles. Le seul moyen était donc de partir sur un modèle open source pour avoir une approche souveraine, francophone, et adaptée aux besoins très juridico-administratifs des métiers”, explique Joël Gombin, patron de la société Datactivist, sollicitée par Etalab pour préparer l’expérimentation. Un travail qui posera les bases de la constitution d’un consortium, ou du moins d’une communauté publique et privée autour des IA génératives de textes en open source. Des IA dont l’entraînement nécessite beaucoup de données, mais aussi de ressources informatiques de calcul.

Explorations anciennes

L’effervescence pour les IA génératives provoquée par l'irruption de ChatGPT et son accessibilité au grand public ne date toutefois pas d’hier. Dans le petit milieu des experts en science des données, les technologies du traitement du langage naturel intéressent depuis de nombreuses années. “Le buzz autour des modèles de langages remonte à 2018 avec la sortie du modèle BERT de Google”, rejoue Romain Le Sur, responsable du Lab de Data Science de l’Insee. “Mais en 2018 comme aujourd’hui avec ChatGPT, nous rencontrons toujours des problèmes de fiabilité, avec des risques d’hallucination et beaucoup d’erreurs”. Ce qui n’empêche pas l’Institut de poursuivre les expérimentations sur des cas d’usages très spécifiques et restreints au domaine informatique. Un assistant est ainsi en cours de développement pour convertir de façon massive des vieux codes informatiques en code R, plébiscité aujourd’hui par les ingénieurs de données.

D’ailleurs, le Laboratoire d’intelligence artificielle de la DINUM a très vite identifié la nécessité de se pencher sur la question et de ne pas se laisser dépasser par une technologie émergente mais dominée par les anglo-saxons. Il travaille depuis plusieurs années déjà sur les technologies du traitement du langage naturel, particulièrement utiles dans les administrations, où les circulaires, rapports et autres notes (et donc l’écrit) sont légions. Le Lab IA a notamment lancé en 2019 la constitution participative d’une base de questions-réponses en français, afin d’entraîner des IA nativement francophones. La base de données “PIAF” a ensuite été utilisée pour diverses applications expérimentales afin, par exemple, de permettre aux agents de poser des questions trouvant leurs réponses dans le Code des relations avec le public (comme “qu’est-ce que l’open data ?” ou “Comment s'exerce le droit d’accès à un document administratif ?”). Ce fut également le cas avec la Direction de l'information légale et administrative (DILA), pour permettre aux usagers cette fois de poser des questions à partir des contenus du site service-public.fr. Le résultat n’a toutefois pas répondu aux besoins de la DILA. “Il s’agissait davantage d’un outil de Questions/réponses” que d’un outil permettant de gérer des logiques conversationnelles en générant des contenus, l’outil se « contentant » de descendre l’arborescence du site service-public.fr”, précise la direction, qui ne baisse pas pour autant les bras et prévoit plusieurs autres expérimentations pour générer des synthèses et résumés des contenus disponibles sur ses différents sites web, ou pour déployer un chatbot amélioré pour décharger le support utilisateurs. La base PIAF a toutefois été utilisée pour améliorer les performances du code du travail numérique.

C’est donc tout naturellement que l’équipe du code du travail s’est précipitée sur ChatGPT. Avec des résultats plus que décevants pour le moment, tant la matière reste complexe, et même inquiétants, car ChatGPT donne l'impression d'avoir la bonne réponse alors qu'elle est truffée d'erreurs. D’autres utilisations paraissent néanmoins plus prometteuses au sein de la Fabrique numérique des ministères sociaux, où est né le code du travail numérique. C’est ainsi que ChatGPT est utilisé non pas dans la relation avec l’usager, mais pour aider à naviguer dans la documentation interne de la fabrique de start-up d'Etat. “L’incubateur a constitué toute une documentation autour de son fonctionnement, de sa méthodologie, de la gestion d’un produit numérique, de son financement, explique son responsable technique Julien Bouquillon. Nous développons donc un chatbot basé sur ChatGPT pour aider les agents à s’y retrouver dans cette documentation”. Un exemple de plus qui montre que les explorations se multiplient, mais se limitent principalement à un cercle d’initiés. D’où l’importance de l’expérimentation sur la plate-forme ServicesPublics+.

Partager cet article

Club des acteurs publics

Votre navigateur est désuet!

Mettez à jour votre navigateur pour afficher correctement ce site Web. Mettre à jour maintenant

×