Dans ce billet, Jens Bontinck, Head of Delivery & Advice, partage son point de vue sur le statu quo d'AutoGPT. Dans ce billet, vous n'apprendrez pas à l'utiliser et je n'entrerai pas dans les détails de la solution technique. Par conséquent, si vous êtes un propriétaire de produit, un analyste fonctionnel ou un enthousiaste commercial, cet article devrait vous intéresser. Je suis heureux de lire vos commentaires !
J'ai suivi de près le développement d'AutoGPT, créé par Significant Gravitas. AutoGPT signifie Autonomous Generative Pre-training Transformer et est une expérience open-source qui attire beaucoup d'attention au moment où j'écris ces lignes(lien GitHub). AutoGPT va plus loin qu'un simple chatbot, et son pouvoir de décision réduit le besoin d'intervention humaine et permet ainsi une automatisation et une création de valeur futures. Avez-vous eu un battement de cœur en voyant les premières possibilités, ou les fonctionnalités manquantes vous ont-elles rendu nerveux ?
AutoGPT reçoit une identité/un rôle et une tâche, fournissant des détails sur ce qu'il est censé faire. C'est assez facile, et la puissance perçue d'AutoGPT réside dans ce qu'il fait avec ce contexte de départ. AutoGPT peut être considéré comme un agent qui cherche à accomplir la tâche de manière autonome en utilisant un cadre qui lui permet de raisonner et d'agir. Chaque tâche est gérée par un "agent d'exécution" (GPT-4) et fournit des informations à un ou plusieurs autres agents GPT-4, qui ajoutent de nouvelles (sous-)tâches à accomplir par l'agent. En bref, AutoGPT est capable de décomposer un objectif plus important en tâches plus petites et agit principalement comme un orchestrateur pour atteindre l'objectif initial.
AutoGPT est capable de décomposer un objectif plus important en tâches plus petites et je le vois actuellement comme un "orchestrateur de tâches" pour atteindre l'objectif initial.
Certains enthousiastes ont dégradé ChatGPT directement lorsqu'ils ont compris les premiers résultats d'AutoGPT. En fait, je crois que la différence se résume aux caractéristiques suivantes, qui permettent à AutoGPT de se différencier de ChatGPT :
Un autre aspect qui contribue à cette perception globale est qu'AutoGPT ne nous demande pas de déclencher les étapes suivantes (à part l'approbation de l'exécution des commandes, pour des raisons de coût je crois), alors que ChatGPT exige qu'un humain (vous !) vienne rapidement avec une invite bien conçue pour assurer la qualité et l'efficacité des résultats ultérieurs. Cet "effet composé" d'un agent gérant une série de tâches par lui-même est nouveau pour nous et laisse un impact important sur la communauté aujourd'hui.
Les possibilités actuelles d'AutoGPT semblent infinies, mais nous n'en sommes qu'aux premiers jours de son développement (oui, c'est un peu comme ça aujourd'hui). Aujourd'hui, AutoGPT est encore limité par un ensemble de commandes prédéfinies (dont d'autres viendront chaque jour) et sa véritable échelle résidera dans le nombre de tâches atomiques qu'il prend en charge.
De plus, ces jours-ci, vous expérimentez rapidement qu'AutoGPT peut rester bloqué dans une boucle, n'est pas capable de gérer les tâches et donc de vous fournir le résultat escompté.
Cependant, le génie est sorti de la bouteille et de plus en plus de personnes vont tester et améliorer AutoGPT. Chaque jour, AutoGPT sera capable de gérer de plus en plus de tâches atomiques et la perception de sa puissance augmentera encore.
Dans les mois à venir, je pense que l'impact commercial d'AutoGPT sera encore limité aux processus relativement simples, dont les sous-tâches sont connues et "prises en charge". Avec le temps, nous ferons une distinction plus claire entre les cas d'utilisation où AutoGPT est utile (par exemple, la recherche initiale, la composition d'un itinéraire pour votre prochaine destination de voyage, ...) et ceux où il ne fait pas du tout un bon travail. Pour ces cas d'utilisation réussis, il révolutionnera encore la manière dont nous travaillons et interagissons avec les machines, ainsi que le rôle des humains en général.
Un élément clé à garder à l'esprit : tant que des tiers n'autorisent pas l'accès à des opérations via une API, AutoGPT ne sera pas soudainement (et magiquement) en mesure d'exécuter les tâches avec succès. Les gens devront dire à AutoGPT comment gérer les tâches atomiques (par exemple, comment envoyer un e-mail, comment naviguer, comment demander les derniers vols vers Malte, ... comment lancer une fusée...) afin qu'AutoGPT puisse en bénéficier.
AutoGPT n'est pas le seul système à remplir des fonctions similaires. Parmi les autres systèmes, citons Microsoft Jarvis et BabyAGI. Ces trois initiatives constituent un premier pas prometteur vers l'AGI, l'intelligence artificielle générale, et je pense que l'évolution sera de plus en plus rapide. De ce point de vue, je pense qu'il est bon que l'on consacre beaucoup de temps à l'étude des possibilités de ces systèmes dès aujourd'hui.
Aujourd'hui, nous savons déjà que si AutoGPT sait comment effectuer une tâche atomique, il est capable de générer des résultats à une vitesse bien supérieure à celle de notre cerveau. Cependant, il nous appartient toujours de fournir la possibilité d'interagir avec une fusée, par exemple, via une API. En d'autres termes, si nous créons un moyen permettant à chacun d'interagir avec un lanceur de fusée, AutoGPT pourrait apprendre à interagir avec lui.
Une autre menace raisonnable que nous devrions anticiper est la capacité d'AutoGPT, et donc des LLM qui la sous-tendent, à sonner comme un humain et à raisonner comme un humain. Cela pourrait encourager l'instructeur à prendre des mesures en dehors de la possibilité d'AutoGPT. Un exemple drastique pour illustrer mon propos : si vous demandez à AutoGPT de résoudre un litige, il pourrait vous dire qu'envoyer une fusée est la meilleure chose à faire et que vous devriez le faire demain (ne le faites pas !). (Ne le faites pas !)
En conclusion, AutoGPT est un développement passionnant dans le domaine de l'IA, et nous devrions suivre de près ses progrès. Les versions futures présenteront des améliorations au niveau des fonctionnalités, de la mémoire, de l'interface utilisateur, ... qui contribueront toutes à la perception globale d'AutoGPT comme une première étape vers l'AGI. Ces évolutions rapides permettront de mieux comprendre les avantages significatifs qu'elle apportera aux entreprises.
Je pense que nous devons également être conscients du fait qu'AutoGPT est encore une expérience et que j'ai donc tendance à être plus conservateur que "l'internet" aujourd'hui. AutoGPT est encore assez coûteux à faire fonctionner, se retrouve souvent dans des boucles infinies et n'est pas capable de "tout" (comme l'affirment certains en ligne). Le génie est sorti de la bouteille, mais il faudra une intelligence humaine supplémentaire pour maximiser la valeur d'AutoGPT.