“AI 登月时刻”,OpenAI 模型摘取奥数金牌

对应老买买提的军事天地,观点交锋比较激烈。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。

版主: Softfist

回复
dreamig楼主
论坛支柱
论坛支柱
帖子互动: 260
帖子: 12089
注册时间: 2022年 7月 26日 22:43

#1 “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 dreamig楼主 »

2025 年 IMO 赛题涵盖了博弈论、数论、函数、平面几何和解析几何等多个方向。ai 参与解答的过程挺公平,断网参与,纯考验模型内嵌的推理能力,不能联网抄作业。

模型在两个 4.5 小时的考试时段内,不能使用任何工具和网络,只能凭借自身对题目的理解,用自然语言写下完整的证明过程。最终,openAI 新模型只错了一道题,做出了前 5 道题,取得惊人的高分 35 分,竞赛满分 42 分。

这件事我看到一批 it 大佬在转,比赛中公认的那道难题,据说只有大约 6 位人类参赛者能够解出,其他的大模型搞压轴题全部都是 0 分,包括 Gemini、DeepSeek、Grok。。。

OpenAI 新的超强模型虽然同样在这道题上折戟,但是还是很超预期。除了这道涉及图形组合数学的第 6 题之外,大模型在数学领域已经全面赶超了人类选手。

回想我们上学的时候,奥数竞赛的那批人一直是最强的群体。现在,大模型已经能够在这个领域取得如此成绩,搞竞赛的意义一下低了很多很多。

竞赛非常像另类的填鸭教育,炒股票是十死一生,竞赛是百死一生,大部分人搞竞赛毫无意义,这次 GPT 攻克了奥数,尤其是在推理模型方面实现了全方位的突破,对教育的影响蛮大的。

AI 已经成为我们最强大的外脑,它可以非常出色地帮助我们完成这些任务。如何善用工具,比单纯死记硬背更重要。AI 突破奥赛之后,现在那些奥赛训练反而变成了机械的刷题,重复劳动这个事情,你怎么可能搞的过机器。。。

与其如此,不如更早地教育和引导小朋友做出有用的项目,更好地利用手头的 AI 工具,这门课其实远比奥赛本身更有意义。

小朋友真正需要点的技能点是语言表达、身体锻炼,再加上科学地运用外脑工具,这可能就足够了。
图片
madao
见习点评
见习点评
帖子互动: 95
帖子: 1371
注册时间: 2022年 10月 11日 23:38

#2 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 madao »

可拉几把倒吧
x2 图片
cache
论坛点评
论坛点评
帖子互动: 214
帖子: 2338
注册时间: 2024年 7月 11日 19:53

#3 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 cache »

openAI摘取的是吹牛和不要脸金牌。


IMO 批评 OpenAI 自封金牌,中国队重夺世界第一

在国际数学奥林匹克(IMO)闭幕式刚结束不到24小时,OpenAI便急于宣布其AI模型获得“金牌”,引发学界广泛批评。
多位IMO评审及业内专家指出,主办方明确要求AI团队至少在闭幕式一周后发布结果,以将关注焦点留给青少年选手,
OpenAI此举被认为是违背规则的商业炒作。
更受质疑的是,OpenAI并非官方合作团队,其成绩未经过91位评委审查,也未遵循官方评分标准,缺乏权威性。
相比之下,谷歌DeepMind等团队选择遵守规定,未提前公布成绩。

在AI争议之外,中国国家队以六金、总分231分重回榜首,连续第七年有选手拿下满分。
本届仅有六人满分,其中两位来自中国队。值得一提的是,AI唯一未解出的第六题被中国选手成功攻克。



dreamig 写了: 2025年 7月 21日 03:20 2025 年 IMO 赛题涵盖了博弈论、数论、函数、平面几何和解析几何等多个方向。ai 参与解答的过程挺公平,断网参与,纯考验模型内嵌的推理能力,不能联网抄作业。

模型在两个 4.5 小时的考试时段内,不能使用任何工具和网络,只能凭借自身对题目的理解,用自然语言写下完整的证明过程。最终,openAI 新模型只错了一道题,做出了前 5 道题,取得惊人的高分 35 分,竞赛满分 42 分。

这件事我看到一批 it 大佬在转,比赛中公认的那道难题,据说只有大约 6 位人类参赛者能够解出,其他的大模型搞压轴题全部都是 0 分,包括 Gemini、DeepSeek、Grok。。。

OpenAI 新的超强模型虽然同样在这道题上折戟,但是还是很超预期。除了这道涉及图形组合数学的第 6 题之外,大模型在数学领域已经全面赶超了人类选手。

回想我们上学的时候,奥数竞赛的那批人一直是最强的群体。现在,大模型已经能够在这个领域取得如此成绩,搞竞赛的意义一下低了很多很多。

竞赛非常像另类的填鸭教育,炒股票是十死一生,竞赛是百死一生,大部分人搞竞赛毫无意义,这次 GPT 攻克了奥数,尤其是在推理模型方面实现了全方位的突破,对教育的影响蛮大的。

AI 已经成为我们最强大的外脑,它可以非常出色地帮助我们完成这些任务。如何善用工具,比单纯死记硬背更重要。AI 突破奥赛之后,现在那些奥赛训练反而变成了机械的刷题,重复劳动这个事情,你怎么可能搞的过机器。。。

与其如此,不如更早地教育和引导小朋友做出有用的项目,更好地利用手头的 AI 工具,这门课其实远比奥赛本身更有意义。

小朋友真正需要点的技能点是语言表达、身体锻炼,再加上科学地运用外脑工具,这可能就足够了。
图片
x2 图片
xiaoju(可爱的龙猫)
论坛元老
论坛元老
帖子互动: 998
帖子: 24786
注册时间: 2023年 9月 5日 20:18

#4 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 xiaoju(可爱的龙猫) »

陶哲轩详细解释了为什么openai的结果属于舞弊
dreamig 写了: 2025年 7月 21日 03:20 2025 年 IMO 赛题涵盖了博弈论、数论、函数、平面几何和解析几何等多个方向。ai 参与解答的过程挺公平,断网参与,纯考验模型内嵌的推理能力,不能联网抄作业。

模型在两个 4.5 小时的考试时段内,不能使用任何工具和网络,只能凭借自身对题目的理解,用自然语言写下完整的证明过程。最终,openAI 新模型只错了一道题,做出了前 5 道题,取得惊人的高分 35 分,竞赛满分 42 分。

这件事我看到一批 it 大佬在转,比赛中公认的那道难题,据说只有大约 6 位人类参赛者能够解出,其他的大模型搞压轴题全部都是 0 分,包括 Gemini、DeepSeek、Grok。。。

OpenAI 新的超强模型虽然同样在这道题上折戟,但是还是很超预期。除了这道涉及图形组合数学的第 6 题之外,大模型在数学领域已经全面赶超了人类选手。

回想我们上学的时候,奥数竞赛的那批人一直是最强的群体。现在,大模型已经能够在这个领域取得如此成绩,搞竞赛的意义一下低了很多很多。

竞赛非常像另类的填鸭教育,炒股票是十死一生,竞赛是百死一生,大部分人搞竞赛毫无意义,这次 GPT 攻克了奥数,尤其是在推理模型方面实现了全方位的突破,对教育的影响蛮大的。

AI 已经成为我们最强大的外脑,它可以非常出色地帮助我们完成这些任务。如何善用工具,比单纯死记硬背更重要。AI 突破奥赛之后,现在那些奥赛训练反而变成了机械的刷题,重复劳动这个事情,你怎么可能搞的过机器。。。

与其如此,不如更早地教育和引导小朋友做出有用的项目,更好地利用手头的 AI 工具,这门课其实远比奥赛本身更有意义。

小朋友真正需要点的技能点是语言表达、身体锻炼,再加上科学地运用外脑工具,这可能就足够了。
图片
Caravel
论坛元老
论坛元老
Caravel 的博客
帖子互动: 571
帖子: 24926
注册时间: 2022年 7月 24日 17:21

#5 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 Caravel »

大模型一般是try 32次,一次对了就算对
x1 图片
dreamig楼主
论坛支柱
论坛支柱
帖子互动: 260
帖子: 12089
注册时间: 2022年 7月 26日 22:43

#6 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 dreamig楼主 »

Caravel 写了: 2025年 7月 21日 07:54 大模型一般是try 32次,一次对了就算对
大模型能否从这个32次挑出正确的解?
x1 图片
FGH
论坛精英
论坛精英
帖子互动: 103
帖子: 6936
注册时间: 2022年 7月 25日 16:30

#7 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 FGH »

去年deepmind得了28分,比金牌线29分只差一分。
近年ChatGPT得了35分,刚好达到金牌线35分。
如果排除打分细节差距的话,基本是平手。
唯一差别是Deepmind做题目是需要人工翻译题目。
FGH
论坛精英
论坛精英
帖子互动: 103
帖子: 6936
注册时间: 2022年 7月 25日 16:30

#8 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 FGH »

xiaoju 写了: 2025年 7月 21日 07:49 陶哲轩详细解释了为什么openai的结果属于舞弊
哪里有?
xiaoju(可爱的龙猫)
论坛元老
论坛元老
帖子互动: 998
帖子: 24786
注册时间: 2023年 9月 5日 20:18

#9 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 xiaoju(可爱的龙猫) »

X上啊
FGH 写了: 2025年 7月 21日 08:10哪里有?
xiaoju(可爱的龙猫)
论坛元老
论坛元老
帖子互动: 998
帖子: 24786
注册时间: 2023年 9月 5日 20:18

#10 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 xiaoju(可爱的龙猫) »

闭源模型的竞赛刷分完全没有意义,第一次得分很可能来自人工团队,而之后的得分来源于背诵答案

这个领域,只有Qwen,deepseek,llama等才有资格涉足
FGH 写了: 2025年 7月 21日 08:10 去年deepmind得了28分,比金牌线29分只差一分。
近年ChatGPT得了35分,刚好达到金牌线35分。
如果排除打分细节差距的话,基本是平手。
唯一差别是Deepmind做题目是需要人工翻译题目。
xiaoju(可爱的龙猫)
论坛元老
论坛元老
帖子互动: 998
帖子: 24786
注册时间: 2023年 9月 5日 20:18

#11 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 xiaoju(可爱的龙猫) »

有人类和各种工具帮忙。。。

去考场限定时间考试,和在家里不限时间,随便翻书咨询专家的得分完全不一样
dreamig 写了: 2025年 7月 21日 07:59 大模型能否从这个32次挑出正确的解?
头像
陈之汉(馆长)
知名作家
知名作家
帖子互动: 48
帖子: 1169
注册时间: 2025年 6月 20日 11:50

#12 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 陈之汉(馆长) »

又炒作,你们美国的AI踏踏实实的搞研究就不行吗?
x1 图片
@迷途知返陈之汉
台湾省政协副主席
FGH
论坛精英
论坛精英
帖子互动: 103
帖子: 6936
注册时间: 2022年 7月 25日 16:30

#13 Re: “AI 登月时刻”,OpenAI 模型摘取奥数金牌

帖子 FGH »

cache 写了: 2025年 7月 21日 06:41 openAI摘取的是吹牛和不要脸金牌。


IMO 批评 OpenAI 自封金牌,中国队重夺世界第一

在国际数学奥林匹克(IMO)闭幕式刚结束不到24小时,OpenAI便急于宣布其AI模型获得“金牌”,引发学界广泛批评。
多位IMO评审及业内专家指出,主办方明确要求AI团队至少在闭幕式一周后发布结果,以将关注焦点留给青少年选手,
OpenAI此举被认为是违背规则的商业炒作。
更受质疑的是,OpenAI并非官方合作团队,其成绩未经过91位评委审查,也未遵循官方评分标准,缺乏权威性。
相比之下,谷歌DeepMind等团队选择遵守规定,未提前公布成绩。

在AI争议之外,中国国家队以六金、总分231分重回榜首,连续第七年有选手拿下满分。
本届仅有六人满分,其中两位来自中国队。值得一提的是,AI唯一未解出的第六题被中国选手成功攻克。
现在DeepMind也拿到了金牌,成绩经过正式批改。不过也没有在闭幕式一周后发布结果。
OPenAI可能没有和IMO合作,所以不必遵守主办方要求。他们请了三个前IMO金牌批改试卷。
回复

回到 “军事天地(Military)”