Les "IA" moissonnent Ma Dada

LaurentS · Juin 28, 2024, 12:49

En jetant un œil aux logs du serveur pour étudier un bug, j’ai remarqué que plusieurs IA lisent notre site, dont ClaudeBot par exemple (moins connu que le chat qui pète, mais qui fait la même chose).

On n’a pas vraiment de position claire sur le sujet, et je pense qu’il pourrait être utile d’en discuter en tâche de fond.
Je pense notamment au fait que ces robots peuvent absorber de l’info venant de nos sites et ensuite en régurgiter des morceaux (dont des données personnelles?) sans qu’on ait vraiment de contrôle là-dessus.

Notre seul levier d’action pour le moment consisterait à leur interdire de patrouiller le site (au moins pour ceux qui suivent les consignes, tiktok et compagnie ne semblent guère se soucier des bonnes manières).

Il y a d’autres questions liées à ces sujets, leur emploi ou non, etc… mais concentrons-nous ici sur la question du moissonnage de contenu.

noellucia · Juin 28, 2024, 1:08

Je pense que c’est une bonne chose de leur interdire le moissonage de contenu.
Normalement, aucune donnée personnelle ne devrait être propagée par ce site, hormis celles des usagers qui ont sciemment choisi d’en propager en connaissance (mon cas par exemple).

pierreobrecht · Juin 28, 2024, 3:01

ben je ne suis pas forcément de cet avis.
si les bots ne moissonnent pas des sites comme madada, les IA sous estimeront le mouvement de demande de doc. administratifs, alors que ce mouvement est réel et qu’il témoigne de l’existence de citoyens exigeants mais confiants dans le fonctionnement démocratique de notre société.
à discuter donc avant de tout fermer

noellucia · Juin 28, 2024, 3:27

Certes, mais est-ce vraiment un problème si elles sous- ou mésestiment ce phénomène ? Je ne pense guère. Les normes juridiques qui régissent l’accès à l’information sont disponibles. Pour l’instant, l’intelligence artificielle n’est pas encore en mesure de saisir les subtilités scientifiques et juridiques qui sous-tendent l’activité d’accès aux informations publiques.

pzwsk · Septembre 28, 2024, 8:58

Ma position initiale sur le sujet est que nous ne devrions pas être pro-actif et ne pas avoir de position de principe à priori sur la restriction de tel ou tel cas d’usage du contenu de notre site.

lcellier · Septembre 30, 2024, 8:42

Une autre possibilitée est de laisser l’accès sous contrepartie financière.
Comme ça l’argent permet d’aider le mouvement.

samgoeta · Septembre 30, 2024, 10:18

Je ne suis pas favorable à empêcher ces bots. les documents et les échanges hébergés sur ma dada sont (en grande majorité) des documents administratifs librement réutilisables. Il y a une certaine incohérence à réclamer ce droit et à vouloir encadrer ce droit pour certains usages.

D’autre part, une mesure de restriction des bots risque de restreindre tous les bots. Je ne prédis pas un grand avenir à ma dada si Google ne référence plus nos pages.

Enfin, les IA (avec tous les problèmes que ça pose) deviennent une des voies d’accès privilégiées à l’info. On risque de se couper de toute une part de la population qui est grandissante.

dupleix · Septembre 30, 2024, 10:32

Personnellement, ça ne me dérange pas non plus (surtout si l’utilisateur de madada rend publique sa demande) et les réponses pour les mêmes raisons évoquées par Samuel. Par ailleurs, l’IA apporte beaucoup sur les recours au Tribunal Administratif, personnellement je l’utilise beaucoup tout en vérifiant et reprenant, mais le gain de temps (bénévole) est consédirable.