不要急于皇冠上的Openai！ Man Zhexuan：“金牌”的_今日看料：蘑菇吃瓜料每日爆料大揭秘

新闻公告

通知公告

不要急于皇冠上的Openai！ Man Zhexuan：“金牌”的

作者：365bet登录日期：2025/07/24 浏览：

昨天，Openai正式宣布了一个大新闻：他们的一种认可模式赢得了国际数学奥运会（IMO）比赛的金牌水平。 OpenAI的研究科学家亚历山大·魏（Alexander Wei）正式宣布了这一消息，他说，在审查时，研究小组严格遵守了玩家竞争的规则：该模型必须阅读官方问题并在两个4.5小时的测试课程中编写自然语言证明，而无需任何网络工具或帮助。在评论中，该模型成功解决了2025年IMO六个问题中的五个，获得了35分（从42分），足以赢得金牌。每个问题都能够在IMO奖牌中得分三个以前的获胜者，最终分数由协议确定。宣布这一消息后，整个AI社区感到兴奋。亚历山大·韦（Alexander Wei）还展示了开发新的OpenAI模型的证据。证明过程：https：//github.com/aw31/openai-imo-2025-proofs/D有趣的是，在亚历山大·韦（Alexander Wei）发布之前不久，宣布各种AI模型以13分执行，而O3（高）得分为7分。 OpenAI模型的新结果的正式宣布为这一事件带来了惊人的回报。但是，在新闻后不久，数学陶兹（Tao Zhexuan）站起来，建议大家“小心”。他认为，如果没有严格控制的标准测试条件，我们将无法以很大的方式将AI模型与人们进行比较，并说：“我们不对任何AI竞争结果评论，报告说他们的程序在Kumpetition之前尚未披露。”这是所有思考AI模型实际开发的触发因素。 Man Zhexuan：仔细研究AI基本模型的IMO成就。 Tao Zhexuan写下了他的博客：人们可以将当前AI的功能视为单个“单一适合所有”指标：实际上，可以通过数量级来扩展AI的功能，DE可以扩展AI的功能。等待什么资源以及所有资源是如何的。 - 由团队（通常是专业数学家）领导的高校学习参加。在两天之内，比赛能够将3个困难的问题与纸张结合，每天4.5小时；在测试期间，比赛和团队负责人不允许交谈，因此他们只能要求监护人澄清问题的含义。在标记论文时，团队负责人为学生辩护，但没有直接参与问题。可能会赢得金牌（此人的商标线为35/42，即完全6个问题5）被认为是高中生的数学成功。但是，如果我们以不同的方式更改奥运会格式，请考虑将发生什么变化：给学生几天来完成每个问题，而不是在四个半小时内完成三个问题。。团队负责人允许学生使用无限的计算器，计算机代数系统，正式助理S，书籍或互联网搜索。团队负责人要求一支由六个团队成员组成的团队同时解决同样的问题，并谈论了他们的发展部位，而死者最终会遇到他们。当学生花费大量时间朝着他们知道自己不太可能成功的方向上花费大量时间时，领导者的动机是可以工作和干扰的。所有六支球队的学生都提交了答案，但领导者只选择了“最佳”答案来提交比赛并丢弃其余的答案。如果没有人会研究团队获得令人满意的答案，那么领导者NG团队将不会提交答案，并悄悄从比赛中退缩，并且他们的参与记录尚不清楚。在上述每种形式中，在高中竞赛中，提交的答案仍比团队负责人开发。但是，竞争中学生报告的成功率可能会受到正式变化的影响。在通常的测试条件下无法达到铜水平的学生或团队s可能在某些修改形式中可以达到金色水平。因此，在没有针对非竞争力团队的选定的，受控的测试方法的情况下，应该在IMO等比赛中执行不同的AI模型或与人们的人的“类似比较”时要谨慎。在这方面，我没有对任何报道的AI竞争性能的结果发表评论，而AI竞争性能在比赛前未披露其程序。 Netizen：值得关注Tao Zhexuan提出的问题的证据值得关注，而网民进行了广泛的讨论。首先，应该指出的是，在帖子中提到的IMO提出的IMO的AI模型可能并不是专门指的是OpenAI模型，因此在此教授的一些问题可能不完全适用于OpenAI。例如，从Openai的语句来看，它们似乎没有使用工具调用。但是，一些人拒绝纪念整个Internet Corpu在培训期间，即使没有通话工具，将它们与无互联网访问学习的人进行比较是不公平的。有人还指出，这些问题不等于对此的护理。从这个OpenAI模型中，我们应该看到的是，AI能够推理并给出正确的“难以证明”字段的答案一个多小时。由于数学数学问题（美国数学竞争系统的高级邀请赛），每个答案都是000-999之间的整数，因此所谓的“困难验证”非常容易验证。无需证明该过程，只需填写数字即可。对于这种类型的问题，我们很容易使用常见的答案来训练模型，并使用强化和其他方法来教育模型来解决这些问题。但是，对于多页的证明，我们总是缺乏明确的培训范式。这也是OpenAI研究最令人兴奋的事情。在模型讨论中，推理研究主管H的指导也尤其是，并且澄清，它们是“在试验期间提高计算和效率强度的许多房间”。如果Openai确实掌握了训练方式让模型解决“难以证明”问题，他们是否迈出了又一步的一步？目前，这些问题并不令人不安。 Openai的方法非常神秘：他们提到GPT-5最近发布了，但他们也清楚地指出，获得IMO金牌的模型不是GPT-5。该模型可以距离几个月。还有一件事：谁是亚历山大·魏（Alexander Wei）领导神秘模型？ IMO金牌的这种理解模特获胜者来自亚历山大·韦（Alexander Wei）主持的团体。诺阿姆·布朗（Noam Brown）提到，在新模式中，亚历山大·韦（Alexander Wei）的想法是，很少有人相信并用它来获取某些人认为取得的成果的结果。亚历山大·韦（Alexander Wei）专注于改善LLM的推理，尤其是在数学上逐渐产生的证明语言。他还赢得了国际信息学奥运会（IOI）金牌。他于2023年获得了加利福尼亚大学伯克利分校的计算机科学博士学位，在尼卡·哈格塔布（Nika Haghtalab），迈克尔·I·乔丹（Michael I.此前，他于2020年在哈佛大学完成了计算机科学的本科和硕士学位。在加入OpenAI之前，Wei博士在Meta AI（Fair），Microsoft Research和D. E. Shaw的行业中丰富的研究和经验。在Meta AI（Fair）的时间里，他参加了Cicero的形成，Cicero是一种AI系统，在战略游戏的外交中达到了TFRESH水平，该系统已发表在2022年的《科学杂志》上。亚历山大·魏（Alexander Wei）小组的作品注入了Openai的射击心脏增强，最近正处于深深的脚步危机中，Noam BRown似乎有兴趣向外界发送重要的信号：OpenAI仍然是切割技术的实验室，其技术在其他实验室的几个月前都有。只要在这里工作，您就可以第一次去做这些事情。你同意她吗？参考链接：https：//x.com/alexwei_/status/1946477777777777772985146HTTPS://x.com/polynoamial/status/194647825249666669523HTTPS