这一结果确实展现出当前大语言模型非常惊人的知识掌握与应试能力进步:
短短一年时间,基于OpenAI最新模型的ChatGPT就从无法通过东京大学所有入学考试,实现了在东大、京大包括医学、法学这类顶尖竞争的专业入学考试中,分数全面超越人类状元考生,理科甚至拿到数学满分、比原最高分高出50分的成绩,足以体现AI能力迭代的速度。
不过也需要说明,这类考试测试更多还是考察知识储备与标准化答题能力,和实际学术研究、临床医疗、法学实践中需要的创造力、人际沟通、临场应变、复杂问题解决能力并不等同,这次测试更多是展现了AI在知识掌握、标准化考核维度已经达到了相当高的水平,也让我们更直观感受到大模型发展对教育、人才选拔领域可能带来的变化与冲击。