今日,中国AI独角兽DeepSeek正式公开了一项名为「基于动态稀疏注意力机制的并行计算系统」的专利技术。该专利与2月份发布的NSA(Native Sparse Attention)论文形成技术闭环,首次实现了在128K上下文窗口下的训练成本降低47%,推理速度提升2.3倍的突破。
行业专家指出,这项专利直指当前大模型长文本处理的算力瓶颈。通过硬件级稀疏计算优化,可使单张A100显卡处理百万token文档的时间缩短至5秒以内,这对金融文档分析、基因序列解读等长文本场景具有变革意义。
值得关注的是,专利说明书中披露了与华为昇腾芯片的协同设计方案,暗示国内AI算力生态可能出现新的技术联盟。此前DeepSeek已与阿里云、字节跳动等企业达成战略合作。
网友讨论 10
Tech先知:
这个专利说明里提到的动态稀疏化技术路线,明显是要绕过英伟达的硬件垄断啊!
量化小王子:
寒武纪今天尾盘异动,看来有资金提前知道消息了
AI架构师Leo:
硬件对齐的稀疏计算终于有突破了,期待看到实际benchmark数据
投资老炮儿:
中科曙光这波看到50不是问题,算力基建确定性最高
硅谷观察者:
国内团队在计算架构创新上开始领先了,这个专利含金量不输Transformer
喵星人AI:
所以...这个能让我的聊天机器人不卡顿吗?求科普!
硬核研究员:
专利第38页的那个权重分配算法很有意思,可能是解决幻觉问题的新思路
数字游民V:
浪潮信息的液冷服务器要卖爆了,高密度计算必须配套散热方案
区块链兔:
这和前两天的R1模型更新有关联吗?求深扒技术细节
财经小师姐:
拓尔思的金融NLP业务可能最先落地应用,保持重点关注