OpenAI développe un outil pour détecter le plagiat avec ChatGPT
OpenAI développe un outil pour détecter le contenu généré par ChatGPT
Dans une course contre la montre pour lutter contre la triche académique à l’ère de l’intelligence artificielle, OpenAI a mis au point une technique prometteuse baptisée « text watermarking » pour détecter si un texte a été produit par son célèbre modèle ChatGPT. Selon le Wall Street Journal, l’entreprise hésite cependant à déployer publiquement cet outil en raison des complexités et impacts potentiels sur l’écosystème numérique.
Le text watermarking, une empreinte numérique invisible
Le text watermarking consiste à apporter de subtiles modifications à la manière dont ChatGPT sélectionne les mots lors de la génération de texte. Ces légères variations créent en quelque sorte une signature numérique invisible dans le texte produit, détectable par un outil d’analyse spécifique. « Cette méthode s’est avérée hautement précise, même face à des tentatives de modification localisée comme le rephrasage », explique OpenAI.
Des risques de contournement et d’impacts néfastes
Malgré son efficacité apparente, le text watermarking n’est pas sans failles. OpenAI reconnaît que « des acteurs malveillants pourraient facilement contourner ce système », par exemple en utilisant des traducteurs automatiques ou d’autres modèles de génération de texte. L’entreprise craint également que cette technique ne stigmatise l’usage d’outils d’IA pour les non-anglophones, renforçant ainsi les inégalités linguistiques.
Une solution plus efficace que les précédentes ?
Contrairement aux précédents systèmes de détection basés sur l’apprentissage automatique qui se sont avérés peu fiables, le text watermarking d’OpenAI cible spécifiquement les textes générés par ChatGPT. Toutefois, cette approche reste limitée aux seuls contenus issus des modèles d’OpenAI, et ne résout pas le problème de la détection de contenu produit par d’autres IA conversationnelles.