13 avril 2023

La réflexion est tout ce dont vous avez besoin ?

Les contributeurs
Jens Bontinck
Chef de Delivery et Advice
Aucun élément trouvé.
S'abonner à la newsletter
Partager cet article

Les choses évoluent rapidement dans le domaine du LLM et de l'IA générative. Beaucoup de choses ont avancé à la vitesse de la lumière. S'agit-il d'un élan temporaire ou sommes-nous au premier jour d'un univers de possibilités en constante expansion ?

Pour ce billet, j'aimerais vous ramener en novembre 2022. À l'époque, ChatGPT a été publié par OpenAI. Probablement considéré comme un BIG BANG par la vaste communauté de l'IA à travers le monde.
Auparavant, de multiples initiatives (par exemple BERT, GPT2,...) étaient plutôt considérées comme des étoiles brillantes dans le ciel qui faisaient scintiller nos yeux, mais la valeur commerciale devait encore être prouvée à plus grande échelle.

Récemment, je me suis renseigné sur les hallucinations et les moyens de les atténuer. L'objectif de ce billet est de partager mon point de vue sur une technique récente appelée Reflexion (lien vers l'article). Est-ce tout ce dont nous avons besoin pour prévenir les hallucinations ?

L'objectif de ce billet est de partager mon point de vue sur une technique récente appelée Réflexion. Est-ce tout ce dont nous avons besoin pour prévenir les hallucinations ?

Bonjour Hallucination

L'hallucination peut être comprise comme "la production de non-sens". Parfois, elle associe des mots, des noms et des idées qui semblent avoir un sens mais qui, en réalité, n'en ont pas. Cela peut se produire lorsque vous posez une question ou que vous avez une conversation avec un LLM (Large Language Model), comme le GPT3.5.

Exemple d'hallucination

Si l'on fait un zoom arrière, l'hallucination provient de l'objectif initial pour lequel ces modèles de langage sont formés (ils sont formés pour prédire le meilleur mot suivant dans une phrase). C'est exactement là que le LLM est tenté de faire des erreurs, et donc de générer des informations erronées.
Bien que cela puisse créer des résultats amusants ou remarquables, cela ne contribue pas à notre industrie de l'information et met donc en péril la fiabilité des LLM.

Présentation de Reflexion

Réflexion est une avancée récente dans l'espace LLM, et il s'agit d'une technique visant à atténuer l'hallucination des modèles génératifs actuels. L'architecture comprend une boucle de rétroaction qui vise à corriger les erreurs courantes et pourrait être considérée comme un "LLM dans la boucle" au lieu d'une approche "humaine dans la boucle". Une technique puissante pour permettre l'autoréflexion sur les résultats en aval, si vous voulez mon avis !

L'approche "LLM-in-the-loop" au lieu de l'approche "human-in-the-loop".

Qu'est-ce que cela signifie exactement ?

Prenons l'exemple concret de la rédaction d'un essai, en supposant que vous en soyez arrivé au point où vous avez besoin d'écrire ce que vous avez appris et ce que vous avez compris de la recherche que vous avez effectuée. Dans le cadre de ce processus de rédaction, il est évident qu'à un moment donné, vous devez commencer à écrire. Que vous écriviez chapitre par chapitre ou que vous preniez d'abord des notes rapides, la seule chose que vous devriez faire, même plus d'une fois, est de relire votre travail. Vous examinez et vous vous demandez si la phrase actuelle représente le message que vous vouliez faire passer. Si c'est le cas, vous êtes satisfait et vous passez à la suivante. Si ce n'est pas le cas, vous vous penchez sur cet élément de contenu spécifique et vous réfléchissez à la formulation qui permettrait de mieux faire passer le message.

C'est également ainsi que fonctionne le concept de réflexion. Si nous demandons à un LLM (par exemple ChatGPT ) de répondre à une question, nous recevons un résultat. Cette technique permet à un autre LLM d'examiner les résultats du modèle précédent. C'est très intéressant et il y a matière à réflexion sur la façon dont cela fonctionnerait si nous empilions plusieurs modèles... - je garderai cela pour un article de blog ultérieur.

Photo par Super Snapper sur Unsplash

Impact sur les applications commerciales ?

Cette technique pourrait améliorer la fiabilité du résultat global et donnerait lieu à des systèmes d'IA plus sûrs et plus fiables (mais probablement plus coûteux, étant donné que davantage de messages-guides sont donnés à un LLM ?) Un système d'IA capable de réfléchir à ses résultats deviendra une liaison plus durable avec les travailleurs du savoir et évitera que ces derniers ne perdent confiance dès le début.

Je m'attends à ce que des techniques supplémentaires et similaires fassent surface plus tôt que tard, et qu'elles aient un impact significatif sur un ensemble diversifié de cas d'utilisation tels que le support client (visant à répondre correctement aux questions de l'utilisateur final) et le journalisme (par exemple, la génération d'articles), où les fausses nouvelles sont déjà un sujet d'actualité.

‍Conclusion- La réflexion suffit-elle ?

La réflexion est une technique intéressante visant à atténuer l'hallucination des LLM. Cela peut être considéré comme l'une des principales luttes du LLM pour devenir encore plus utile. Imaginez que nous puissions croire tout ce qu'il génère comme réponse ? Cela bouleverserait notre façon de traiter l'information dans notre industrie de l'information.

Reflexion est-il tout ce dont vous avez besoin ?... Si vous voulez mon avis, c'est une technique prometteuse, mais je m'attends à ce que d'autres techniques fassent également leur apparition. Je m'attends à une configuration hybride avec, par exemple, Reflexion et une ingénierie prompte avancée qui fournira de meilleurs résultats au fil du temps.

Postes connexes

Voir tout le contenu
Aucun résultat n'a été trouvé.
Il n'y a pas de résultats correspondant à ces critères. Essayez de modifier votre recherche.
Grand modèle linguistique
Modèles de fondation
Entreprise
Personnes
Données Structurées
Chat GPT
Durabilité
Voix et son
Développement frontal
Protection des données et sécurité
IA responsable/éthique
Infrastructure
Hardware et capteurs
MLOps
IA générative
Natural Language Processing
Vision par ordinateur