Mener une recherche assistée par l’IA générative

Une aide possible à chaque étape

Un rapide exploration des outils existants pour la recherche démontre qu’il existe une offre abondante, bien qu’encore balbutiante pour chaque étape d’un processus de recherche, et qu’un agent conversationnel généraliste peut également prendre en charge de nombreuses tâches, soit directement, soit au travers d’extensions dédiées (les “GPTs” de chatGPT). C’est l’objet de la section “étapes du processus de recherche avec des exemples d’IA génératives”

Plus encore que pour des usages classiques, il est important de vérifier rigoureusement le résultat proposé, tant en termes d’exactitude, de qualité, que d’originalité, de le retravailler pour qu’il corresponde exactement au processus envisagé, et de mener des investigations complémentaires et indépendantes pour obtenir un résultat satisfaisant.
Le terme “assistant” s’applique particulièrement dans le cadre d’un processus de recherche. En effet, outre le risque inhérent de biais, une IA générative propose un résultat “le plus probable”, ce qui vient en contradiction avec la poursuite de l’originalité d’un travail de recherche. Comme il est impossible de tracer l’ensemble des sources ayant conduit au résultat, vous vous exposez à un risque de copie d’idée que vous ne pourrez pas sourcer.
En l’état, un ensemble d’agents d’IA génératives ne peut remplacer l’humain, mais une coopération entre une équipe d’humains et d’agents d’IA génératives peut conduire à des résultats plus rapides et de meilleure qualité.
Pour autant, l’utilisation des IA génératives doit se faire en respectant les principes de base qui encadrent ces usages dans les différentes institutions. Un cadre européen s’impose par défaut (voir Living guidelines on the responsible use of generative AI in research, dont une synthèse en français est disponible, et sert de base pour cette section.

Recommandations

Rester ultimement responsable du résultat scientifique
- Les chercheurs et chercheuses sont responsables de l’intégrité du contenu généré avec l’aide d’outils d’IAg.
- Il est nécessaire de maintenir une approche critique et de prendre ou avoir conscience des limites des outils (biais, hallucinations, inexactitudes)
- Les systèmes d’IAg ne sont ni auteurs ni co-auteurs.
  - La paternité des contenus implique l’agentivité et la responsabilité, elle incombe donc aux chercheurs et chercheuses.
- Ne pas utiliser de matériel fabriqué par l’IAg pour falsifier ou manipuler des données de recherche.
Utiliser l’IA générative de manière transparente
- Détailler quels outils d’IAg ont été utilisés de manière substantielle dans le processus de recherche.
  - Si c’est pertinent, rendre disponibles les « prompts » et les résultats, conformément aux principes de science ouverte.
- Tenir compte de la nature stochastique des outils et viser la reproductibilité et la robustesse de leurs résultats et conclusions.
  - Divulguer ou discuter des limitations des outils d’IA générative utilisés, y compris les biais possibles dans le contenu généré.
Faire attention aux questions de confidentialité et de propriété intellectuelle
- Avoir conscience que les données entrées dans une IA générative pourraient être réutilisées pour entraîner des modèles d’IA.
  - Protéger les travaux non publiés ou sensibles en veillant à ne pas les télécharger dans un système d’IA en ligne, sauf s’il y a des garanties que les données ne seront pas réutilisées, par exemple pour entraîner de futurs modèles de langage ou pour une réutilisation non traçable et non vérifiable des données.
- Obtenir le consentement avant de fournir des données personnelles de tiers.
- Comprendre les implications techniques et éthiques des outils utilisés concernant la confidentialité, la protection des données et les droits de propriété intellectuelle.
Respecter la législation applicable
- Faire attention au risque de plagiat dans l’utilisation des résultats de l’IA.
- Gérer de manière responsable toute donnée personnelle générée par l’IA.
Se former en continu à l’utilisation appropriée des outils d’IA générative
- Les chercheurs et chercheuses se tiennent au courant des meilleures pratiques et les partagent avec leurs collègues et autres parties prenantes.
S’abstenir d’utiliser substantiellement les outils d’IA générative dans des activités sensibles qui pourraient avoir un impact sur d’autres recherches
- Protéger les travaux originaux non publiés des autres chercheurs ou chercheuses d’une exposition potentielle ou d’une inclusion dans un modèle d’IA.

Principes clés

Ces recommandations s’appuient sur les principes de l’intégrité scientifique qui peuvent être déclinées comme suit dans le cadre de l’usage d’IA génératives :

Fiabilité
- Implique une qualité de la recherche à chaque étape : conception, méthode, analyse et utilisation des ressources. Cela implique de vérifier et de reproduire les informations fournies par l’IA. Il est également crucial de rester attentif aux questions d’égalité et de discrimination, car l’IA peut comporter des biais ou des erreurs.
Honnêteté
- Exige une transparence à chaque étape, y compris la divulgation de l’utilisation de l’IA générative. Elle implique une conduite juste, complète et impartiale, avec une attention particulière à la vérification des informations produites par l’IA et à la prise en compte des questions d’égalité.
Respect
- Le respect en recherche inclut la considération pour les collègues, les participantes et participants, la société, les écosystèmes, le patrimoine culturel et l’environnement. L’utilisation responsable de l’IA générative doit tenir compte des limites de la technologie, de son impact environnemental et de ses effets sociétaux, telles que les biais, la diversité, la non-discrimination et l’équité. Cela comprend aussi une gestion appropriée des informations, le respect de la vie privée, de la confidentialité, des droits de propriété intellectuelle et une citation correcte des sources.
Responsabilité en recherche
- La responsabilité en recherche couvre chaque étape, de l’idée initiale à la publication, y compris la gestion, l’organisation, la formation, la supervision et le mentorat. Elle prend en compte les impacts sociétaux plus larges. Les chercheurs et chercheuses sont responsables de tous les résultats produits, en s’appuyant sur l’intervention et la supervision humaines.