模型在两个 4.5 小时的考试时段内,不能使用任何工具和网络,只能凭借自身对题目的理解,用自然语言写下完整的证明过程。最终,openAI 新模型只错了一道题,做出了前 5 道题,取得惊人的高分 35 分,竞赛满分 42 分。
这件事我看到一批 it 大佬在转,比赛中公认的那道难题,据说只有大约 6 位人类参赛者能够解出,其他的大模型搞压轴题全部都是 0 分,包括 Gemini、DeepSeek、Grok。。。
OpenAI 新的超强模型虽然同样在这道题上折戟,但是还是很超预期。除了这道涉及图形组合数学的第 6 题之外,大模型在数学领域已经全面赶超了人类选手。
回想我们上学的时候,奥数竞赛的那批人一直是最强的群体。现在,大模型已经能够在这个领域取得如此成绩,搞竞赛的意义一下低了很多很多。
竞赛非常像另类的填鸭教育,炒股票是十死一生,竞赛是百死一生,大部分人搞竞赛毫无意义,这次 GPT 攻克了奥数,尤其是在推理模型方面实现了全方位的突破,对教育的影响蛮大的。
AI 已经成为我们最强大的外脑,它可以非常出色地帮助我们完成这些任务。如何善用工具,比单纯死记硬背更重要。AI 突破奥赛之后,现在那些奥赛训练反而变成了机械的刷题,重复劳动这个事情,你怎么可能搞的过机器。。。
与其如此,不如更早地教育和引导小朋友做出有用的项目,更好地利用手头的 AI 工具,这门课其实远比奥赛本身更有意义。
小朋友真正需要点的技能点是语言表达、身体锻炼,再加上科学地运用外脑工具,这可能就足够了。
