L’article scientifique intitulé “Performance of a large language model on the reasoning tasks of a physician” publié dans la revue Science en avril 2026 s’inscrit dans une dynamique récente d’évaluation rigoureuse des capacités des modèles de langage avancés (LLM) dans des tâches complexes de raisonnement clinique. Cette étude constitue l’une des analyses les plus approfondies à ce jour comparant directement les performances d’un système d’intelligence artificielle à celles de médecins humains dans des situations proches de la pratique réelle, notamment en contexte d’urgence.
Performance d'un modèle de langage complexe sur les tâches de raisonnement d'un médecin
Résumé de l'étude
L’objectif principal de la recherche est d’évaluer dans quelle mesure un modèle de langage de nouvelle génération — en l’occurrence un modèle de la série o1 — est capable de reproduire ou d’égaler les processus cognitifs mobilisés par les médecins lorsqu’ils doive...
Pour accéder à ce contenu,
créez votre compte
gratuitement
Accéder à :
- L'ensemble de la veille e-santé sélectionnée
par la communauté Beesens, - Des documents de références de la e-santé,
- Et bien plus encore...
Déjà inscrit ? Identifiez-vous