« En un an, on est passé de près de 1 000 à 10 000 sites d'actu en français générés par IA »

Jean-Marc Manach est journaliste d'investigation. Il décrypte comment fonctionne l'internet depuis la fin des années 90 et s'est penché en 2025 sur l'émergence des sites d'actualité générés par l'IA qui inondent le web.

Cécile Massin
Cécile Massin

Après de nombreuses années en tant qu'indépendant, il travaille aujourd'hui pour le média Next, spécialisé sur le numérique et les nouvelles technologies. En février 2025, il publiait l'enquête « Plus de 1000 médias en français, générés par IA, polluent le web (et Google) » pour Next.

Un an plus tard, il revient pour Rembobine sur l'utilité d'unir ses forces avec une rédaction nationale, l'importance de l'extension créée par Next pour signaler les médias générés par IA, et les risques démocratiques que ces derniers font courir.

Bonjour Jean-Marc. Comment avez-vous commencé à lister les sites générés par IA qui pullulent sur Internet ?

Comme beaucoup de journalistes, je m'informe via Google Alerts [outil de veille qui permet de recevoir les actualités, NDLR]. J'ai commencé à tiquer quand j'ai commencé à recevoir des alertes Google qui me renvoyaient vers des sites que je ne connaissais ni d'Eve ni d'Adam. Je me suis aperçu que ces sites étaient générés par IA grâce à un faisceau d'indices : les mentions légales étaient mensongères ou manquantes, les prétendu·es journalistes n'avaient pas de profil sur les réseaux sociaux, les articles comprenaient des listes à puces, etc. J'ai commencé à noter leurs URL et peu à peu, j'ai découvert l'ampleur du problème.

Dans votre enquête, vous révélez avoir découvert près de 1 000 sites générés par IA. Pour tous les vérifier, vous n'avez pas travaillé seul. Racontez-nous.

L'an dernier, alors que je n'avais identifié que 75 sites, j'ai proposé à mes étudiant·es de m'aider à vérifier les sites que j'avais commencé à identifier, car la tâche était tentaculaire. Je me suis aussi rapproché de CheckNews [service de vérification de l'information de Libération, NDLR] pour qu'on unisse nos forces. Je savais aussi que ça permettrait de donner de l'ampleur à l'enquête, notamment d'un point de vue médiatique, car l'écho que peut avoir un média comme Libération n'est pas le même qu'un petit média comme Next.

[Récap] Nous avons découvert des milliers de sites d’info générés par IA : tous nos articles - Next

Un an après, continuez-vous à recenser de nouveaux sites générés par IA ?

Oui et honnêtement, je ne m'attendais pas à en trouver autant. En un an, mon tableau de données est passé de près de 1 000 à 10 000 sites en français générés par IA, et ce n'est que la partie émergée de l'iceberg. Il y a encore très certainement des milliers voire des dizaines de milliers de sites générés par IA que je n'ai pas recensés. Je sais que je ne serai jamais exhaustif. Disons que j'ai listé ceux qui génèrent le plus de trafic. Et de plus en plus de « gros » médias « grand public » s'y mettent aussi !

Vous ne citez pas le nom des médias qui figurent dans votre liste de données. Pourquoi ?

Je mentionne les noms des sites auxquels je consacre des articles spécifiques, mais je ne peux pas consacrer des articles à l'ensemble des 10 000 sites que j'ai identifiés. Je ne veux pas non plus être accusé de faire du « name and shame ». Surtout, mon objectif est avant tout d'alerter, d'un point de vue général, sur la prolifération de ces sites et d'aider celles et ceux qui le souhaitent à ne pas tomber dans le panneau des sites générés par IA. C'est d'ailleurs pour ça qu'à Next, nous avons développé une extension qui permet d'alerter les utilisateur·trices quand iels consultent un site dont les articles ont été, tous ou en partie, générés par IA. L'extension leur permet également de nous signaler les sites qui leur paraissent être générés par IA : j'ai reçu plus de 2 000 signalements et il m'en reste plus d'une centaine à vérifier. C'est un travail titanesque.

Médias sans journaliste : quand l’IA s’empare de l’information
Le journaliste Jean-Marc Manach s’est attelé à une tâche vertigineuse : celle de lister le nombre de médias générés par IA en français, avant d’être propulsés sur nos écrans de téléphone et d’ordinateur avec la complicité de Google.

Découvrez l'enquête en détails ainsi que notre mesure d'impact

Face à l'ampleur de l'IA et sa vitesse de développement, avez-vous parfois l'impression de chercher une aiguille dans une botte de foin ?

C'est peu de le dire. J'ai l'impression de faire face à un tsunami avec une petite cuillère : je suis là, avec ma minuscule cuillère en train d'écoper dans un bateau qui coule. Mais arrêter de travailler sur le sujet n'est pas une option, car les risques liés à ces médias générés par IA sont trop importants.

Il y a le risque de désinformation et de propagation des fake news, bien sûr, mais c'est aussi très dangereux pour les médias dits traditionnels. Face à ces faux sites, qui sont pourtant très consultés, ils ont perdu des centaines de millions de pages vues, et donc de revenus publicitaires. C'est un vrai problème pour l'économie des médias ! Médiamétrie a d'ailleurs découvert que les 250 sites générés par IA les plus recommandés par Google étaient, à eux seuls, visités par 15 millions de personnes en moyenne par mois, soit un quart des internautes français (dont 75% de plus de 50 ans) !

Sans parler du fait qu'en dupliquant leurs articles, tous ces médias générés par IA diffusent des versions différentes d'une même histoire sans que ces dernières ne soient vérifiées. Ça participe à créer du doute sur ce qui est vrai et ce qui ne l'est pas or, plus les gens ont des doutes sur ce qu'est ou non un fait vérifié, plus les risques sont grands de voir arriver des gouvernements autoritaires. On s'en rend bien compte, notamment dans les États-Unis de Trump.

🏗️ Les coulisses de l'info

Cécile Massin

Rédactrice et cofondatrice de Rembobine - Journaliste indépendante