DeepSeek披露新一代AI专利技术,原生稀疏计算或颠覆行业

  • 时间:2025-04-02 13:36
  • 评论:10
今日,中国AI独角兽DeepSeek正式公开了一项名为「基于动态稀疏注意力机制的并行计算系统」的专利技术。该专利与2月份发布的NSA(Native Sparse Attention)论文形成技术闭环,首次实现了在128K上下文窗口下的训练成本降低47%,推理速度提升2.3倍的突破。
行业专家指出,这项专利直指当前大模型长文本处理的算力瓶颈。通过硬件级稀疏计算优化,可使单张A100显卡处理百万token文档的时间缩短至5秒以内,这对金融文档分析、基因序列解读等长文本场景具有变革意义。
值得关注的是,专利说明书中披露了与华为昇腾芯片的协同设计方案,暗示国内AI算力生态可能出现新的技术联盟。此前DeepSeek已与阿里云、字节跳动等企业达成战略合作。
—————— 分享 ——————

网友讨论 10

  • Tech先知:

    这个专利说明里提到的动态稀疏化技术路线,明显是要绕过英伟达的硬件垄断啊!

  • 量化小王子:

    寒武纪今天尾盘异动,看来有资金提前知道消息了

  • AI架构师Leo:

    硬件对齐的稀疏计算终于有突破了,期待看到实际benchmark数据

  • 投资老炮儿:

    中科曙光这波看到50不是问题,算力基建确定性最高

  • 硅谷观察者:

    国内团队在计算架构创新上开始领先了,这个专利含金量不输Transformer

  • 喵星人AI:

    所以...这个能让我的聊天机器人不卡顿吗?求科普!

  • 硬核研究员:

    专利第38页的那个权重分配算法很有意思,可能是解决幻觉问题的新思路

  • 数字游民V:

    浪潮信息的液冷服务器要卖爆了,高密度计算必须配套散热方案

  • 区块链兔:

    这和前两天的R1模型更新有关联吗?求深扒技术细节

  • 财经小师姐:

    拓尔思的金融NLP业务可能最先落地应用,保持重点关注

热门股票