ChatGPT booste les notes des étudiants — mais surtout quand personne ne regarde

ChatGPT booste les notes des étudiants — mais surtout quand personne ne regarde

ChatGPT booste les notes des étudiants — mais surtout quand personne ne regarde

Une étude de l'Université de Californie à Berkeley a passé au peigne fin plus de 500 000 notes. Verdict : depuis l'arrivée de ChatGPT, les copies brillent davantage. Sauf en examen surveillé. Étrange coïncidence, non ?

Si les étudiants étaient soudainement devenus plus intelligents fin 2022, ça se saurait. Et pourtant, à en croire les chiffres, c'est exactement ce qui semble s'être passé sur certains campus américains. Des chercheurs de Berkeley ont épluché un demi-million de notes attribuées à l'Université de Californie pour comprendre l'effet réel des grands modèles de langage sur les performances académiques. Leur conclusion est aussi peu surprenante qu'embarrassante : ChatGPT fait grimper les notes, mais pas pour les raisons que les brochures marketing aimeraient nous vendre.

La preuve par le contraste

L'étude se concentre sur les cours où l'IA est la plus utile, ceux qui réclament beaucoup de rédaction ou de code. Logique : c'est précisément là où un assistant conversationnel peut faire la différence entre une dissertation moyenne et une copie qui semble avoir été pondue par un étudiant brillant un peu trop éveillé pour un dimanche soir. Depuis le déploiement massif de ChatGPT, les notes dans ces disciplines ont nettement augmenté. Pas un frémissement statistique : une vraie tendance, visible à grande échelle.

Mais le détail qui change tout, c'est la répartition de cette hausse. Elle se concentre presque exclusivement sur les devoirs à rendre à la maison, ceux qu'on fait tranquillement devant son écran, café à portée de main et onglet ChatGPT discrètement ouvert dans le coin. En revanche, dès qu'on bascule en examen surveillé — sans accès aux LLM, sans navigateur, parfois même sans clavier — les résultats restent désespérément stables. Comme si le miracle pédagogique s'évaporait dès que l'étudiant se retrouvait seul face à sa propre cervelle.

Les chercheurs en tirent une conclusion sans détour : l'IA ne rend pas les étudiants meilleurs, elle fait le travail à leur place. La compétence affichée sur la feuille de notes ne correspond plus à la compétence réellement acquise. Et plus le décalage entre devoir maison et examen est grand, plus le soupçon de sous-traitance algorithmique devient lourd.

Le casse-tête de l'évaluation à l'ère des LLM

Ce résultat, en soi, ne devrait surprendre personne qui a mis les pieds dans une salle de classe ces deux dernières années. Les profs le constatent depuis longtemps : copies suspectes au style un peu trop lisse, références fantômes, plans tristement génériques, et cette manière si particulière qu'a ChatGPT de finir chaque paragraphe par une formule consensuelle. Ce que Berkeley apporte, c'est la mesure. Un chiffre, une tendance, une preuve quantitative que beaucoup de devoirs maison sont devenus, dans les faits, une évaluation des compétences de prompt plutôt qu'un examen des connaissances.

Le problème dépasse largement la simple question de la triche. Il touche à la nature même de ce qu'on évalue. Pendant des décennies, le devoir à la maison reposait sur un pari implicite : l'étudiant fera l'effort, parce que cet effort est ce qui produit l'apprentissage. Le résultat noté n'était qu'un proxy. Aujourd'hui, ce pari ne tient plus. Le proxy s'est détaché du processus qu'il était censé refléter, et personne ne sait très bien comment rattraper le coup.

Les réponses possibles sont toutes inconfortables. Revenir massivement aux examens sur table ? C'est ignorer que le monde professionnel, lui, utilise ces outils tous les jours, et qu'on prépare donc des étudiants à un univers qui n'existe plus. Intégrer pleinement l'IA dans les évaluations ? C'est repenser de fond en comble ce qu'on note, comment, et pour quoi faire. Faire semblant que tout va bien ? C'est ce que beaucoup d'établissements font déjà, avec les résultats qu'on imagine.

Berkeley met le doigt sur quelque chose qu'on préférerait peut-être ne pas voir : les notes ne mesurent plus ce qu'elles prétendent mesurer. Ce n'est ni la faute des étudiants, qui utilisent rationnellement les outils disponibles, ni vraiment celle des profs, dépassés par la vitesse à laquelle la technologie reconfigure leur métier. C'est plutôt le signal qu'un modèle d'évaluation vieux de plusieurs siècles vient de prendre un coup de vieux sévère. Le devoir maison, version 2024, est devenu un test de motivation à ne pas ouvrir ChatGPT. Autant dire un test que peu d'humains rationnels réussissent.

La vraie question n'est plus de savoir si l'IA va transformer l'éducation. Elle le fait déjà, silencieusement, copie après copie. La question, c'est de savoir si les institutions vont enfin admettre que leur système de mesure est devenu fictif — ou continuer à célébrer des moyennes en hausse en regardant ailleurs.

Et vous, faut-il interdire l'IA dans les études ou repenser entièrement la manière dont on évalue ?


Source : https://the-decoder.com/ai-is-inflating-student-grades-and-the-effect-points-to-outsourced-work-not-better-learning/

Read more