ia generative en entreprise bonnes pratiques risques

Bien utiliser l’IA générative en entreprise : bonnes pratiques, risques et limites à connaître

Ce texte a été écrit par un humain assisté par une IAgen pour uniformiser le ton et la graphie du contenu. Les informations ont toutes été validées par des humains experts dans le domaine. L’image d’entête a été générée par une IAgen à partir d’un prompt de l’auteur.

Comment bien utiliser une IAgen?

On ne se le cachera pas, une IAgen bien utilisée peut sauver beaucoup de temps. Il est important de comprendre cependant que l’utilisateur doit déjà bien comprendre le sujet et être en mesure de « challenger » la réponse de l’IAgen. Contrairement aux IA, les IAgen sont beaucoup plus à risque de se tromper étant donné leur nature. Connaître son domaine d’affaires et connaître la sortie attendue est un avantage qu’auront les meilleurs utilisateurs. S’il n’est pas possible à l’utilisateur de vérifier la sortie du générateur, il peut introduire un bogue de logique qui induira une hallucination artificielle.

Sachez ce que vous tentez d’obtenir avant d’interroger l’IAgen

Cela peut sembler contre-intuitif, mais c’est la clé de la réussite avec ces outils. Il ne s’agit pas de connaître la réponse exacte (car dans ce cas, vous n’auriez sans doute pas besoin d’interroger une IAgen), mais d’au moins en connaître la nature. Sachez également comment vérifier les faits donnés par les IAgen. Certains donneront leurs sources. Prenez la peine de vérifier que ces sources existent réellement, car il peut arriver que l’IAgen s’invente des sources, et que l’IAgen a bien résumé la source mentionnée. S’il ne donne pas ses sources, penser à valider sa réponse en effectuant une recherche classique sur la réponse donnée. Ne vous fiez pas à une IA pour vérifier la réponse d’une IA. Apprenez à valider manuellement.

Le meilleur terme qu’on peut utiliser est « Assistant » ou « Co-pilote ». Il ne s’agit pas de remplacer l’humain, mais de le rendre plus efficace. Étant donné que les IAgen ne « réfléchissent » pas au sens strict, il faut les guider. Bien guidées, elles vous donneront des résultats qui répondront à vos attentes.

Les IAgen sont généralement meilleures pour vérifier que pour créer

C’est un constat paradoxal, mais la force des IAgen n’est pas de générer, mais de vérifier, valider, modifier. Elles ne sont pas idéales pour créer. Les débats sur les droits d’auteur et de propriété intellectuelle viennent entre autres de ce constat. Vous voulez modifier le ton d’un courriel, les IAgen brillent sur ce point. Vous voulez optimiser du code, vous êtes au bon endroit. Vous voulez écrire un article de journal, attendez-vous au pire si vous n’aviez au départ qu’une page blanche.

Les utilisateurs qui utilisent déjà les IAgen pour accélérer leur travail l’ont constaté. Le premier jet de l’IAgen (non spécialisé) va en général produire une sortie discutable, mais vous lui demandez de corriger la sortie qu’il a lui-même générée, et il sera déjà beaucoup mieux.

La véritable puissance des IA est dans la reconnaissance d’agencement (patterns).

La précision vaut plus que le flou

Il y a une balance pour tout, mais plus un prompt est précis, plus précise sera la réponse. Fournir des exemples, des spécifications détaillées, donner un rôle à l’agent, spécifier des sources spécifiques, toutes ces astuces vous permettront d’avoir une réponse dont les risques d’hallucinations sont grandement réduits, mais également où la qualité de la réponse reçue sera supérieure.

Quels sont les risques ?

On résume souvent les risques aux trois points suivants : les fuites, la vie privée et la propriété intellectuelle. Il faut toutefois savoir qu’il en existe plusieurs autres. Je vous présente ici une liste un peu plus élaborée, mais qui n’est pas exhaustive. Elle a pour objectif d’éveiller la vigilance et de proposer d’autres pistes de réflexion.

Fuite d’informations

Assurez-vous de toujours bien vérifier les conditions d’utilisations. La majorité des outils IA utilise les données en entrées et les sorties générées pour s’entraîner par la suite. Les données d’entraînement font ensuite partie du système et peuvent faire partie des réponses qui seront générées par les IAgen par la suite. Mettre des informations sensibles, ou donner accès à des données sensibles, à des IAgen revient à avoir fuité ces informations sensibles au public.

Vie privée

Il y a deux niveaux de vie privée. La vôtre directement, et celle des autres, parfois indirectement. Une fois de plus, vérifier les conditions d’utilisation des données. Alexa, Gemini, Siri, ils sont tous pratiques, mais est-ce qu’ils envoient vos données personnelles et celles de vos contacts lorsque vous l’interrogez? N’oubliez pas que vous êtes responsables des données que vous partagez directement, mais pensez également au fait que vous pouvez partager des informations de personnes tierces et que ces personnes n’ont généralement pas donné leur consentement pour partager ces données. Je vous invite à visiter le site de la Commission d’accès à l’information du Québec pour plus d’information.

Propriété intellectuelle

On peut le séparer en deux sous-points. La première, ce sont les droits d’auteurs des sources d’entraînement. Des milliards de textes, d’images, de sons, de vidéos. Toutes ces données, utilisées « sans permission », malgré leur présence dans le domaine public. Nous l’avons mentionné plus tôt, les IAgen ne créent pas, ils modifient. Tout ce qui est généré est en fait le produit d’un entraînement sur des milliards d’exemples existants. Il est même possible de recopier un style que nous aimons en ajoutant au prompt « dans le style de… ». Tout le débat vient donc du fait que la machine peut simuler un artiste, un écrivain, ou autre.

L’autre point, c’est la propriété intellectuelle elle-même. Légalement parlant, le prompt appartient à la personne qui l’a écrit, mais la sortie de l’IAgen, au moment d’écrire cet article, dans la majorité des juridictions actuelles, n’est pas protégée par les droits d’auteur. Non seulement ça, mais en plus, sa sortie est en général utilisée pour s’auto-entraîner par la suite. Donc pour le moment, la sortie générée par une IA seule n’est pas protégée par les droits d’auteurs. (Toutefois, si vos artistes altèrent cette sortie en l’utilisant comme « inspiration », ce résultat-là le sera.) Assurez-vous de bien comprendre ces nuances juridiques avant d’utiliser du matériel « assisté » par une IAgen.

La surconfiance

Je l’ai répété à de nombreuses reprises au cours de cette série, mais les IAgen sont exceptionnelles dans leur capacité à produire du contenu crédible en apparence, mais dont le contenu est faux, incomplet, ou carrément inventé. Prenez toujours pour acquis que la sortie d’un générateur est un canevas, mais que vous devez ajouter votre couleur. Dans certains cas, la réponse peut s’avérer être correcte, mais prenez pour acquis qu’il y a toujours une erreur. Restez critiques et vigilants face à ce que les IAgen produisent et tout devrait bien aller.

Dépendance cognitive et perte d’expertise interne

Un autre risque plus subtil est la dépendance cognitive : lorsque l’IA devient la source principale de raisonnement, l’expertise humaine peut s’éroder si elle n’est pas entretenue activement. En clair, à force d’utiliser une IAgen pour rédiger, analyser, résumer et proposer, les utilisateurs peuvent perdre progressivement la maîtrise du raisonnement métier, voire même développer, à leur insu, une certaine forme de paresse intellectuelle où il devient plus facile de faire une requête que d’analyser réellement la situation. Il y a également un risque à long terme de perdre sa capacité à challenger la réponse donnée par l’IAgen.

Dans les bonnes pratiques, on demande généralement de valider avec plus d’une source. Ma recommandation personnelle : utiliser plus d’une IA, c’est bien, mais valider également avec des êtres humains experts c’est mieux. Un autre truc est de demander à l’IAgen de challenger l’utilisateur. (Attention, le biais de complaisance pourrait causer l’IA à générer systématiquement des contradictions pour « challenger » les idées. À utiliser avec précaution.) L’important est de se remettre en question et à continuer de valider les sorties.

Biais implicite et normalisation

Les IAgen n’ont pas d’intentions malveillantes, en fait, elles n’ont pas d’intention du tout. Cependant, elles ont été entraînées sur un certain jeu de données. Elles ont donc « appris » à reproduire des modèles parfois réducteurs. Elles vont normaliser certaines visions du monde, elles vont privilégier des formulations plus « présentes » sur les médias, atténuer des avis divergents ou minoritaires. Il y aura donc une perte de diversité. Et comme les IAgen reprennent leur propre sortie pour continuer de s’entraîner, cela creuse encore plus le fossé entre ces différentes opinions. Nous avons vu un cas extrême en 2016 avec Microsoft Tay. En s’entraînant sur des données des utilisateurs de la plateforme Twitter, Tay a développé des comportements… disons dérangeants. Il faut comprendre que sur internet, ce n’est pas toujours la vérité qui est la plus présente, surtout sur les réseaux sociaux. Si dans ses données d’entraînement, l’IA voit dix mille articles qui prônent une propagande mensongère contre cent articles qui dénoncent ce mensonge pour montrer la vérité, malheureusement, l’IA ne comprend pas le contexte et ne critique pas le texte, il apprend seulement à reproduire ces textes, et apprendra donc un mensonge causé par une trop forte présence de celui-ci dans ses données d’entraînement. Je vais le répéter, ayez le réflexe de demander ses sources à l’IA, surtout lorsqu’il est question de génération de texte. Vous pouvez également lui demander s’il n’a pas des sources d’opinion différente de la réponse suggérée. Faites-vous votre propre opinion, et restez vigilants et critiques.

Responsabilité et traçabilité

Voici un exemple de chose à ne pas faire : « Pourquoi avons‑nous choisi cette option ? → Parce que l’IA le suggérait ». Même si la décision s’avérait bonne, c’est un très mauvais argument. Un article est paru récemment où une personne s’obstinait à dire à un employé de stationnement souterrain que son véhicule pouvait passer, car ChatGPT lui avait confirmé alors que l’employé savait pertinemment que ce n’était pas le cas. Baser ses décisions sur un texte généré « pseudoaléatoirement » par une machine qui ne connaît pas la réalité dans laquelle nous évoluons, c’est toujours une mauvaise décision, que la réponse soit bonne ou mauvaise. Dans un exemple comme celui-ci, il faut se demander « qui est responsable de l’erreur? » et « est-ce que ça peut être reproduit? ». Ce ne sont pas toutes les IA qui sont en mesure de fournir les traces claires de leur processus de raisonnement. Pour la première question, ma réponse personnelle est toujours la même le responsable de l’erreur est l’utilisateur qui a demandé l’aide d’une IA sans valider la réponse qui lui avait été générée. Par contre, ce n’est pas une opinion que tout le monde partage, blâmant le processus plutôt que l’individu. Je vous laisse vous faire votre propre opinion à ce sujet. Ce qui est clair cependant, c’est qu’il n’est pas sain de se dégager de nos responsabilités de nos propres erreurs sous prétexte que « l’IA me l’a dit ».

Utilisations hors contextes (drift)

On suggère une recette, un prompt qui fonctionne dans un certain contexte, vous vous mettez à l’appliquer, vous oubliez son contexte original, vous vous mettez à utiliser un prompt qui n’est pas adapté à la situation, vous obtenez un résultat où les hallucinations et les erreurs abondent. L’expression « savoir utiliser le bon outil au bon moment » s’adapte bien dans le contexte. Vous n’utiliseriez pas une poêle à frire pour dévisser une vis… Vous n’utiliseriez pas non plus un logiciel de dessin pour faire votre rapport d’impôt. Les prompts sont les outils à notre disposition pour interagir avec un outil à la fois pratique, mais fragile, car il dépend de milliers de paramètres. Garder toujours en tête ce que vous voulez faire. N’appliquez pas aveuglément une « recette pré-faite ». Comme mentionné précédemment, les IA ne sont pas toutes équivalentes. Apprenez à utiliser la bonne IA pour ses forces dans une situation donnée plutôt qu’une IA générique pour tous vos besoins. Il existe d’ailleurs, pour ces cas d’utilisations, des « regroupeurs » d’IA, comme Perplexity, Aymo AI, Elvex, Eleven Labs, etc. Vérifiez toujours leurs conditions d’utilisations, mais ces agrégateurs sont de véritables coffres à outils souvent offerts à moindre prix que de payer pour chaque outil individuellement.

Écart entre l’interne et le « reste du monde »

À moins d’avoir entraîné une IA explicitement sur vos propres données, l’IA ne connaît pas vos règles internes. Ce sera le cas pour la totalité des IA publiques. Elles vont se baser sur les données publiques uniquement, mais celles-ci ne s’appliquent probablement pas à votre contexte spécifique. Elle pourrait donc faire des recommandations non conformes, ignorer certaines contraintes, causer des incohérences, ne pas répondre à certaines normes, etc.

Exemples de bonne utilisation

Comme mentionner dans l’intro de tous les articles de la série, « ce texte a été écrit par un humain assisté par une IAgen ». En fait, je me suis servi de plusieurs agents. J’ai tout d’abord écrit mon premier jet dans Word, sachant que Copilot M365 serait pratique pour la suite. Une fois le premier jet construit, j’ai utilisé un premier prompt utilisant le concept PIS et mon truc pour la réduction d’hallucination pour recadrer les réponses que Copilot devait me répondre.

« Tu es un expert en intelligence artificielle au sens large. Tu es quelqu’un de très factuel qui ne se base que sur des sources vérifiées et fiables. Tu as reçu pour mandat de vérifier le contenu de ces quatre articles de blogues afin de vérifier l’exactitude des faits mentionnés. Les articles doivent rester accessibles autant pour quelqu’un qui connaît un peu le domaine que pour des clients curieux. Un premier jet a été soumis et on te demande ton avis. Il s’agit d’un article qui se veut léger et vulgarisateur pour des collègues à l’interne, mais aussi qui pourrait être lu par les clients. On tente ici d’informer tout en restant sur un ton un peu léger. On te demande de toujours rester factuel et de fournir tes sources. En cas d’incertitude de plus de 10%, réponds simplement que tu ne sais pas en donnant des sources où l’information pourrait être disponible pour se faire notre propre idée. »

Ce prompt n’est pas une recette à suivre, mais il illustre les concepts mentionnés.

Une fois les bases en place, j’interrogeais sur différents aspects : la densité du texte, des cas que j’aurais pu avoir oubliés, des reformulations pour certaines phrases trop techniques, etc.. Comme il me répondait avec des sources, j’ai pu ajouter certains des liens qu’il me donnait et que je trouvais pertinents dans la section « toujours curieux ». Je lui ai également demandé de faire la vérification de certains faits inscrits dans le document (même si ce n’est pas la force principale de Copilot).

Une fois l’écriture complétée, j’ai fait un premier passage de correction avec Antidote, puis j’ai fait relire à des personnes représentatives de mon public cible, puis j’ai apporté les suggestions de ces lecteurs au document.

Par la suite, après une dernière vérification par Copilot, j’ai passé le flambeau à Gemini par l’intermédiaire de NotebookLM. Je lui ai donné un mandat similaire à Copilot, mais cette fois, en lui demandant de vérifier toutes les erreurs factuelles qui auraient pu se glisser. Il a trouvé des erreurs qu’Antidote avait échappées, mais surtout certains faits qui ne faisaient pas l’unanimité au niveau de la communauté scientifique. En validant avec plus d’une IA, on réduit les risques de biais. (Un peu comme lorsqu’on demande l’avis de plusieurs experts avant de prendre une décision importante.)

Puis, j’ai terminé avec une dernière relecture par des collègues (humains) et quelqu’un de représentatif de mon public cible. L’article était prêt à être envoyé pour publication.

Pour ce qui est de la traduction anglaise, un système automatique a également suggéré un premier jet lequel a été relu pour valider la terminologie, surtout le côté technique. Ici non plus, il ne s’agit pas d’une recette à suivre, mais plutôt d’une suggestion d’utilisation responsable à adapter à vos besoins et situations.

Donc en utilisant l’outil de façon responsable, nous sommes arrivés à cette série d’articles qui, je l’espère, vous aura aidé à démystifier les IA et IAgen.

En bref

Les IAgen sont d’excellents outils pour nous assister dans les tâches répétitives du quotidien, mais ne sont pas là pour remplacer un humain. Il faut rester vigilant et sensible aux risques. Soyez alertes, et apprenez à bien utiliser ces outils qui peuvent devenir une façon d’améliorer vos performances. Ils sont très pratiques, mais ils ont tout de même leurs limites.


Toujours curieux ? Si le sujet vous intéresse et que vous voulez en apprendre davantage, je vous suggère de visiter les sources suivantes :