“AI 登月时刻”，OpenAI 模型摘取奥数金牌

dreamig · 帖子由 **dreamig楼主** » 2025年 7月 21日 03:20

2025 年 IMO 赛题涵盖了博弈论、数论、函数、平面几何和解析几何等多个方向。ai 参与解答的过程挺公平，断网参与，纯考验模型内嵌的推理能力，不能联网抄作业。

模型在两个 4.5 小时的考试时段内，不能使用任何工具和网络，只能凭借自身对题目的理解，用自然语言写下完整的证明过程。最终，openAI 新模型只错了一道题，做出了前 5 道题，取得惊人的高分 35 分，竞赛满分 42 分。

这件事我看到一批 it 大佬在转，比赛中公认的那道难题，据说只有大约 6 位人类参赛者能够解出，其他的大模型搞压轴题全部都是 0 分，包括 Gemini、DeepSeek、Grok。。。

OpenAI 新的超强模型虽然同样在这道题上折戟，但是还是很超预期。除了这道涉及图形组合数学的第 6 题之外，大模型在数学领域已经全面赶超了人类选手。

回想我们上学的时候，奥数竞赛的那批人一直是最强的群体。现在，大模型已经能够在这个领域取得如此成绩，搞竞赛的意义一下低了很多很多。

竞赛非常像另类的填鸭教育，炒股票是十死一生，竞赛是百死一生，大部分人搞竞赛毫无意义，这次 GPT 攻克了奥数，尤其是在推理模型方面实现了全方位的突破，对教育的影响蛮大的。

AI 已经成为我们最强大的外脑，它可以非常出色地帮助我们完成这些任务。如何善用工具，比单纯死记硬背更重要。AI 突破奥赛之后，现在那些奥赛训练反而变成了机械的刷题，重复劳动这个事情，你怎么可能搞的过机器。。。

与其如此，不如更早地教育和引导小朋友做出有用的项目，更好地利用手头的 AI 工具，这门课其实远比奥赛本身更有意义。

小朋友真正需要点的技能点是语言表达、身体锻炼，再加上科学地运用外脑工具，这可能就足够了。

madao · 帖子由 **madao** » 2025年 7月 21日 04:50

可拉几把倒吧

cache · 帖子由 **cache** » 2025年 7月 21日 06:41

openAI摘取的是吹牛和不要脸金牌。

IMO 批评 OpenAI 自封金牌，中国队重夺世界第一

在国际数学奥林匹克（IMO）闭幕式刚结束不到24小时，OpenAI便急于宣布其AI模型获得“金牌”，引发学界广泛批评。
多位IMO评审及业内专家指出，主办方明确要求AI团队至少在闭幕式一周后发布结果，以将关注焦点留给青少年选手，
OpenAI此举被认为是违背规则的商业炒作。
更受质疑的是，OpenAI并非官方合作团队，其成绩未经过91位评委审查，也未遵循官方评分标准，缺乏权威性。
相比之下，谷歌DeepMind等团队选择遵守规定，未提前公布成绩。

在AI争议之外，中国国家队以六金、总分231分重回榜首，连续第七年有选手拿下满分。
本届仅有六人满分，其中两位来自中国队。值得一提的是，AI唯一未解出的第六题被中国选手成功攻克。

dreamig 写了： 2025年 7月 21日 03:20 2025 年 IMO 赛题涵盖了博弈论、数论、函数、平面几何和解析几何等多个方向。ai 参与解答的过程挺公平，断网参与，纯考验模型内嵌的推理能力，不能联网抄作业。

模型在两个 4.5 小时的考试时段内，不能使用任何工具和网络，只能凭借自身对题目的理解，用自然语言写下完整的证明过程。最终，openAI 新模型只错了一道题，做出了前 5 道题，取得惊人的高分 35 分，竞赛满分 42 分。

这件事我看到一批 it 大佬在转，比赛中公认的那道难题，据说只有大约 6 位人类参赛者能够解出，其他的大模型搞压轴题全部都是 0 分，包括 Gemini、DeepSeek、Grok。。。

OpenAI 新的超强模型虽然同样在这道题上折戟，但是还是很超预期。除了这道涉及图形组合数学的第 6 题之外，大模型在数学领域已经全面赶超了人类选手。

回想我们上学的时候，奥数竞赛的那批人一直是最强的群体。现在，大模型已经能够在这个领域取得如此成绩，搞竞赛的意义一下低了很多很多。

竞赛非常像另类的填鸭教育，炒股票是十死一生，竞赛是百死一生，大部分人搞竞赛毫无意义，这次 GPT 攻克了奥数，尤其是在推理模型方面实现了全方位的突破，对教育的影响蛮大的。

AI 已经成为我们最强大的外脑，它可以非常出色地帮助我们完成这些任务。如何善用工具，比单纯死记硬背更重要。AI 突破奥赛之后，现在那些奥赛训练反而变成了机械的刷题，重复劳动这个事情，你怎么可能搞的过机器。。。

与其如此，不如更早地教育和引导小朋友做出有用的项目，更好地利用手头的 AI 工具，这门课其实远比奥赛本身更有意义。

小朋友真正需要点的技能点是语言表达、身体锻炼，再加上科学地运用外脑工具，这可能就足够了。

xiaoju

陶哲轩详细解释了为什么openai的结果属于舞弊

dreamig 写了： 2025年 7月 21日 03:20 2025 年 IMO 赛题涵盖了博弈论、数论、函数、平面几何和解析几何等多个方向。ai 参与解答的过程挺公平，断网参与，纯考验模型内嵌的推理能力，不能联网抄作业。

模型在两个 4.5 小时的考试时段内，不能使用任何工具和网络，只能凭借自身对题目的理解，用自然语言写下完整的证明过程。最终，openAI 新模型只错了一道题，做出了前 5 道题，取得惊人的高分 35 分，竞赛满分 42 分。

这件事我看到一批 it 大佬在转，比赛中公认的那道难题，据说只有大约 6 位人类参赛者能够解出，其他的大模型搞压轴题全部都是 0 分，包括 Gemini、DeepSeek、Grok。。。

OpenAI 新的超强模型虽然同样在这道题上折戟，但是还是很超预期。除了这道涉及图形组合数学的第 6 题之外，大模型在数学领域已经全面赶超了人类选手。

回想我们上学的时候，奥数竞赛的那批人一直是最强的群体。现在，大模型已经能够在这个领域取得如此成绩，搞竞赛的意义一下低了很多很多。

竞赛非常像另类的填鸭教育，炒股票是十死一生，竞赛是百死一生，大部分人搞竞赛毫无意义，这次 GPT 攻克了奥数，尤其是在推理模型方面实现了全方位的突破，对教育的影响蛮大的。

AI 已经成为我们最强大的外脑，它可以非常出色地帮助我们完成这些任务。如何善用工具，比单纯死记硬背更重要。AI 突破奥赛之后，现在那些奥赛训练反而变成了机械的刷题，重复劳动这个事情，你怎么可能搞的过机器。。。

与其如此，不如更早地教育和引导小朋友做出有用的项目，更好地利用手头的 AI 工具，这门课其实远比奥赛本身更有意义。

小朋友真正需要点的技能点是语言表达、身体锻炼，再加上科学地运用外脑工具，这可能就足够了。

Caravel · 帖子由 **Caravel** » 2025年 7月 21日 07:54

大模型一般是try 32次，一次对了就算对

dreamig · 帖子由 **dreamig楼主** » 2025年 7月 21日 07:59

Caravel 写了： 2025年 7月 21日 07:54 大模型一般是try 32次，一次对了就算对

大模型能否从这个32次挑出正确的解？

FGH · 帖子由 **FGH** » 2025年 7月 21日 08:10

去年deepmind得了28分，比金牌线29分只差一分。
近年ChatGPT得了35分，刚好达到金牌线35分。
如果排除打分细节差距的话，基本是平手。
唯一差别是Deepmind做题目是需要人工翻译题目。

FGH · 帖子由 **FGH** » 2025年 7月 21日 08:10

xiaoju 写了： 2025年 7月 21日 07:49 陶哲轩详细解释了为什么openai的结果属于舞弊

哪里有？

xiaoju

X上啊

FGH 写了： 2025年 7月 21日 08:10哪里有？

xiaoju

闭源模型的竞赛刷分完全没有意义，第一次得分很可能来自人工团队，而之后的得分来源于背诵答案

这个领域，只有Qwen，deepseek，llama等才有资格涉足

FGH 写了： 2025年 7月 21日 08:10 去年deepmind得了28分，比金牌线29分只差一分。
近年ChatGPT得了35分，刚好达到金牌线35分。
如果排除打分细节差距的话，基本是平手。
唯一差别是Deepmind做题目是需要人工翻译题目。

xiaoju

有人类和各种工具帮忙。。。

去考场限定时间考试，和在家里不限时间，随便翻书咨询专家的得分完全不一样

dreamig 写了： 2025年 7月 21日 07:59 大模型能否从这个32次挑出正确的解？

陈之汉

又炒作，你们美国的AI踏踏实实的搞研究就不行吗？

FGH · 帖子由 **FGH** » 2025年 7月 22日 08:34

cache 写了： 2025年 7月 21日 06:41 openAI摘取的是吹牛和不要脸金牌。

IMO 批评 OpenAI 自封金牌，中国队重夺世界第一

在国际数学奥林匹克（IMO）闭幕式刚结束不到24小时，OpenAI便急于宣布其AI模型获得“金牌”，引发学界广泛批评。
多位IMO评审及业内专家指出，主办方明确要求AI团队至少在闭幕式一周后发布结果，以将关注焦点留给青少年选手，
OpenAI此举被认为是违背规则的商业炒作。
更受质疑的是，OpenAI并非官方合作团队，其成绩未经过91位评委审查，也未遵循官方评分标准，缺乏权威性。
相比之下，谷歌DeepMind等团队选择遵守规定，未提前公布成绩。

在AI争议之外，中国国家队以六金、总分231分重回榜首，连续第七年有选手拿下满分。
本届仅有六人满分，其中两位来自中国队。值得一提的是，AI唯一未解出的第六题被中国选手成功攻克。

现在DeepMind也拿到了金牌，成绩经过正式批改。不过也没有在闭幕式一周后发布结果。
OPenAI可能没有和IMO合作，所以不必遵守主办方要求。他们请了三个前IMO金牌批改试卷。

新未名空间

“AI 登月时刻”，OpenAI 模型摘取奥数金牌

#1 “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#2 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#3 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#4 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#5 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#6 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#7 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#8 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#9 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#10 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#11 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#12 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌

#13 Re: “AI 登月时刻”，OpenAI 模型摘取奥数金牌