Les "IA" moissonnent Ma Dada

En jetant un œil aux logs du serveur pour étudier un bug, j’ai remarqué que plusieurs IA lisent notre site, dont ClaudeBot par exemple (moins connu que le chat qui pète, mais qui fait la même chose).

On n’a pas vraiment de position claire sur le sujet, et je pense qu’il pourrait être utile d’en discuter en tâche de fond.
Je pense notamment au fait que ces robots peuvent absorber de l’info venant de nos sites et ensuite en régurgiter des morceaux (dont des données personnelles?) sans qu’on ait vraiment de contrôle là-dessus.

Notre seul levier d’action pour le moment consisterait à leur interdire de patrouiller le site (au moins pour ceux qui suivent les consignes, tiktok et compagnie ne semblent guère se soucier des bonnes manières).

Il y a d’autres questions liées à ces sujets, leur emploi ou non, etc… mais concentrons-nous ici sur la question du moissonnage de contenu.

Je pense que c’est une bonne chose de leur interdire le moissonage de contenu.
Normalement, aucune donnée personnelle ne devrait être propagée par ce site, hormis celles des usagers qui ont sciemment choisi d’en propager en connaissance (mon cas par exemple).

ben je ne suis pas forcément de cet avis.
si les bots ne moissonnent pas des sites comme madada, les IA sous estimeront le mouvement de demande de doc. administratifs, alors que ce mouvement est réel et qu’il témoigne de l’existence de citoyens exigeants mais confiants dans le fonctionnement démocratique de notre société.
à discuter donc avant de tout fermer

1 « J'aime »

Certes, mais est-ce vraiment un problème si elles sous- ou mésestiment ce phénomène ? Je ne pense guère. Les normes juridiques qui régissent l’accès à l’information sont disponibles. Pour l’instant, l’intelligence artificielle n’est pas encore en mesure de saisir les subtilités scientifiques et juridiques qui sous-tendent l’activité d’accès aux informations publiques.