En jetant un œil aux logs du serveur pour étudier un bug, j’ai remarqué que plusieurs IA lisent notre site, dont ClaudeBot par exemple (moins connu que le chat qui pète, mais qui fait la même chose).
On n’a pas vraiment de position claire sur le sujet, et je pense qu’il pourrait être utile d’en discuter en tâche de fond.
Je pense notamment au fait que ces robots peuvent absorber de l’info venant de nos sites et ensuite en régurgiter des morceaux (dont des données personnelles?) sans qu’on ait vraiment de contrôle là-dessus.
Notre seul levier d’action pour le moment consisterait à leur interdire de patrouiller le site (au moins pour ceux qui suivent les consignes, tiktok et compagnie ne semblent guère se soucier des bonnes manières).
Il y a d’autres questions liées à ces sujets, leur emploi ou non, etc… mais concentrons-nous ici sur la question du moissonnage de contenu.
Je pense que c’est une bonne chose de leur interdire le moissonage de contenu.
Normalement, aucune donnée personnelle ne devrait être propagée par ce site, hormis celles des usagers qui ont sciemment choisi d’en propager en connaissance (mon cas par exemple).
ben je ne suis pas forcément de cet avis.
si les bots ne moissonnent pas des sites comme madada, les IA sous estimeront le mouvement de demande de doc. administratifs, alors que ce mouvement est réel et qu’il témoigne de l’existence de citoyens exigeants mais confiants dans le fonctionnement démocratique de notre société.
à discuter donc avant de tout fermer
Certes, mais est-ce vraiment un problème si elles sous- ou mésestiment ce phénomène ? Je ne pense guère. Les normes juridiques qui régissent l’accès à l’information sont disponibles. Pour l’instant, l’intelligence artificielle n’est pas encore en mesure de saisir les subtilités scientifiques et juridiques qui sous-tendent l’activité d’accès aux informations publiques.
Ma position initiale sur le sujet est que nous ne devrions pas être pro-actif et ne pas avoir de position de principe à priori sur la restriction de tel ou tel cas d’usage du contenu de notre site.
Je ne suis pas favorable à empêcher ces bots. les documents et les échanges hébergés sur ma dada sont (en grande majorité) des documents administratifs librement réutilisables. Il y a une certaine incohérence à réclamer ce droit et à vouloir encadrer ce droit pour certains usages.
D’autre part, une mesure de restriction des bots risque de restreindre tous les bots. Je ne prédis pas un grand avenir à ma dada si Google ne référence plus nos pages.
Enfin, les IA (avec tous les problèmes que ça pose) deviennent une des voies d’accès privilégiées à l’info. On risque de se couper de toute une part de la population qui est grandissante.
Personnellement, ça ne me dérange pas non plus (surtout si l’utilisateur de madada rend publique sa demande) et les réponses pour les mêmes raisons évoquées par Samuel. Par ailleurs, l’IA apporte beaucoup sur les recours au Tribunal Administratif, personnellement je l’utilise beaucoup tout en vérifiant et reprenant, mais le gain de temps (bénévole) est consédirable.