Le Centre pour les médias, la technologie et la démocratie (MTD) de l’Université McGill a mené, entre février et mars 2026, le premier audit empirique à grande échelle sur la manière dont les modèles d’IA utilisent et diffusent le journalisme canadien.
Le Centre a notamment testé quatre grands modèles d’IA (ChatGPT, Gemini, Claude et Grok) sur 2 267 articles d’actualité canadiens réels, en anglais et en français (18 134 requêtes au total), afin de déterminer ce que les modèles avaient assimilé de leurs données d’entraînement et s’ils en citaient la source.
L’organisme a ensuite activé la recherche sur le Web et interrogé ces mêmes modèles sur environ 140 articles récents spécifiques provenant de sept médias canadiens, dans 3 360 conditions expérimentales, afin de déterminer si les modèles d’IA produisent des substituts viables au journalisme actuel et s’ils citent la source.
Lorsqu’ils répondent à des questions sur des évènements présents dans leurs données d’entraînement (sans accès au Web), les modèles démontrent une connaissance des faits dans 74 % des cas, mais 92 % de ces réponses ne fournissent aucune attribution de source.
Un choix de conception
Même avec la recherche Web activée, bien que 52 % des réponses incluent au moins un lien (URL), les modèles ne nomment explicitement la source dans le texte que 28 % du temps.
Par exemple, Gemini couvre le contenu distinctif d’un reportage dans 81 % des cas, mais ne crédite la source que 6 % du temps.
L’audit souligne que l’absence de citation n’est pas une incapacité technique, mais un choix de conception.
En effet, lorsque l’utilisateur demande explicitement à l’IA de citer ses sources, les taux de citation augmentent de façon spectaculaire. Claude atteint 97 % de citations nommées, Grok atteint 74 %.
À noter également que ce phénomène de substitution et de manque d’attribution touche également les contenus protégés par des verrous d’accès payants.
Selon l’audit, les modèles d’IA couvrent le contenu payant à un taux de 64 %, ce qui est tout à fait comparable au taux de couverture du contenu gratuit, qui s’élève à 70 %.
La plupart des informations publiées derrière un verrou payant finissent par être disponibles gratuitement ailleurs, que ce soit par le biais d’agences de presse, d’agrégateurs ou de partages sur les réseaux sociaux. Les modèles d’IA parviennent ainsi à récupérer la substance de l’information sans passer par la source originale payante, explique le rapport du Centre pour les médias, la technologie et la démocratie.
« Vol de notre propriété intellectuelle »
Le chef de la direction de Médias d’Info Canada, Paul Deegan, a été interrogé par La Liberté pour réagir à ces informations.
Pour lui, le constat est clair : « nous assistons à un vol de notre propriété intellectuelle à une échelle industrielle. »
« Des entreprises comme Google, Microsoft, OpenAI, Perplexity et même la société canadienne Cohere ont été accusées de récupérer du contenu protégé par le droit d’auteur directement à partir d’articles de presse publiés.
« Ces entreprises ne se contentent pas de fournir des extraits que l’on trouverait avec une recherche Google classique ; elles fournissent des résumés très détaillés, privant ainsi les éditeurs de presse de leur audience, de leurs abonnements et de leurs revenus publicitaires », ajoute-t-il.
« Les actualités constituent une donnée indispensable au fonctionnement des entreprises spécialisées dans l’intelligence artificielle, et aucun référencement ne devrait avoir lieu sans consentement préalable, mention de la source, rémunération équitable et possibilité réelle de refus – c’est à l’utilisateur de rémunérer le créateur », indique Paul Deegan.
Quelles solutions?
Paul Deegan demande donc au gouvernement fédéral « de contribuer à mettre fin à ce vol. » Le représentant de Médias d’Info Canada évoque plusieurs pistes de solutions.
« Services publics et Approvisionnement Canada et le Conseil du Trésor du Canada peuvent collaborer pour s’assurer que les fournisseurs d’intelligence artificielle figurant sur la liste des fournisseurs intéressés du gouvernement signent un engagement des fournisseurs à soutenir les efforts du gouvernement du Canada pour montrer la voie en matière d’IA éthique, qui inclut un engagement envers les principes de transparence, de consentement et d’attribution concernant tout contenu source protégé par le droit d’auteur. »
Le ministère de l’Industrie pourrait aussi demander au Bureau de la concurrence de mener une étude sur l’état de la concurrence en matière de recherche et d’IA, dit Paul Deegan.
Enfin, selon Paul Deegan, la Loi sur le droit d’auteur ne devrait pas être modifiée pour inclure une exception relative à l’exploration de textes et de données. « Les titulaires de droits doivent être protégés – sans aucune exception », insiste-t-il.


