OpenAI, l’entreprise qui a créé ChatGPT, a conçu un système de mesure interne pour suivre les progrès et la puissance de ses grands modèles linguistiques (LLM), qui sont des modèles d’apprentissage profond pré-entraînés sur de grandes quantités de données exploitées par l’IA pour effectuer des tâches telles que répondre à des questions, résumer des documents, traduire des langues, générer ou éditer des images vidéo et audio, et ainsi de suite.
Avec les chatbots tels que ChatGPT, selon OpenAI, nous sommes au niveau 1 et nous approchons du niveau 2, ce dernier étant défini comme un système capable de résoudre des problèmes de base, comme le ferait une personne titulaire d’un doctorat. Le niveau 3 se réfère à des agents d’IA capables d’effectuer des actions au nom de l’utilisateur.
Le niveau 4 devrait permettre de développer des innovations, tandis que le niveau 5, celui qui devrait permettre l’AGI (intelligence générale artificielle), est indiqué comme un objectif qui permettra à l’IA de faire le travail d’entreprises et d’organisations entières à elle seule.
C’est ce qu’a rapporté un porte-parole d’OpenAI à Bloomberg, expliquant que cette échelle, à l’instar des cinq niveaux de classification de la conduite autonome (prenant en compte la mesure dans laquelle un véhicule peut prendre en charge les tâches du conducteur en cas de besoin), est utile pour aider à fournir une définition plus rigoureuse des progrès, sans laisser place à l’interprétation.
OpenAI affirme que nous sommes actuellement proches du niveau 2 sur l’échelle menant à l’AGI, précédemment définie comme “un système hautement autonome qui surpasse les humains dans la plupart des tâches à valeur économique“.
Malgré les progrès réalisés, l’objectif de l’AGI est encore loin d’être atteint (certains affirment même qu’il ne sera jamais possible d’atteindre ce niveau). Il faudra de plus en plus de puissance de calcul, et tous les experts ne sont pas d’accord sur le calendrier. Le PDG d’OpenAI, Sam Altman, a déclaré en 2023 qu’il fallait “cinq ans, plus ou moins” pour parvenir à l’AGI ; Elon Musk a également fait des déclarations similaires.
L’idée d’un système d’évaluation des modèles d’IA a été présentée dans le cadre de l’annonce de la collaboration d’OpenAI avec le laboratoire national de Los Alamos, dans le but d’explorer des modèles d’IA avancés susceptibles d’aider la recherche en biosciences. L’objectif du laboratoire du ministère américain de l’énergie est de tester en toute sécurité les capacités de GPT-4o en évaluant certains modèles publics et privés en fonction de ces facteurs.