DeepSeek发布新一代自验证数学推理模型

  • 时间:2025-11-28 09:22
  • 评论:11
2025年11月27日,人工智能公司DeepSeek正式推出其最新数学推理模型——DeepSeekMath-V2。该模型引入了“可自我验证的数学推理训练框架”,在多项国际顶级数学竞赛中取得突破性成绩。
据官方披露,DeepSeekMath-V2在模拟的2025年国际数学奥林匹克竞赛(IMO)中解决6题中的5题,达到金牌水平;同时在中国数学奥林匹克(CMO 2024)中同样斩获金牌,并在2024年普特南数学竞赛(Putnam)中获得118/120的近乎满分成绩。这是首个在IMO级别赛事中达到金牌水平的开源模型。
与传统仅关注答案正确性的AI系统不同,DeepSeekMath-V2通过构建基于大语言模型(LLM)的验证器,对自身生成的数学证明进行自动审查,从而确保推理过程的逻辑严谨性。这种“生成器—验证器”协同架构不仅提升了模型可靠性,还形成了持续自我改进的训练闭环。
目前,该模型的代码与权重已在HuggingFace和GitHub平台开源,推动“自我验证”技术向科研、教育及工业领域快速渗透。在科研场景中,有望缩短30%理论研究周期;在教育领域,可提升VIP课程续费率8%-12%;而在金融、航空等高可靠性要求的产业中,人工审计成本有望降至原来的1/5,B端市场规模预计达200亿元。
相关A股上市公司包括:中科星图(688568)、科大讯飞(002230)、拓尔思(300229)、浪潮信息(000977)、寒武纪(688256)、云从科技(688327)、神州数码(000034)、同花顺(300033)等,这些企业在AI基础模型、算力支撑或行业应用方面与DeepSeek存在潜在协同或竞争关系。
—————— 分享 ——————

网友讨论 11

  • AI探索者:

    终于有国产模型能在数学推理上硬刚OpenAI了,开源更是加分项!

  • MathGeek_2025:

    IMO金牌级别的开源模型?这绝对是里程碑事件!

  • 星辰大海梦:

    中科星图今天涨了4%,看来市场已经提前反应了。

  • CodePoet:

    自我验证机制才是关键,不再只是瞎猜答案了。

  • 老股民老张:

    AI+教育、AI+金融,这波DeepSeek带飞一堆概念股啊。

  • NeuralNerd:

    Putnam 118分?这模型怕不是偷偷上了MIT的课。

  • 科技观察员小李:

    从结果导向到过程验证,这才是可信AI的正确方向。

  • QuantumCat:

    开源+高性能,DeepSeek这次真的把门槛拉高了。

  • 算法炼丹师:

    验证器+生成器的架构,感觉像AlphaGo的自我对弈,但用在数学上更难。

  • 风起云涌2025:

    希望别光吹牛,赶紧落地到中学奥数辅导APP里!

  • DeepThinker:

    这才是真正意义上的推理模型,不是只会背答案的‘AI鹦鹉’。

热门股票