阿里云AI突破：GPU用量削减82%

时间：2025-10-20 08:30
评论：12

近日，阿里云推出的计算池化解决方案"Aegaeon"在AI模型服务领域取得重大进展，该方案通过创新资源管理技术，成功入选顶级学术会议SOSP 2025。Aegaeon系统专注于解决GPU资源浪费问题，利用GPU资源池化打破传统"一个模型绑定一个GPU"的低效模式，大幅提升资源利用率。

在阿里云模型市场为期超三个月的Beta测试中，Aegaeon系统服务数十个720亿参数量的大模型时，所需英伟达H20 GPU数量从1192个减至213个，削减比例高达82%。这意味着企业硬件采购成本显著降低，尤其对依赖成千上万张GPU的大型AI服务商至关重要，如动辄节省数百万美元支出。

此前，AI服务中存在严重资源闲置：数据显示，17.7%的GPU算力仅处理1.35%的用户请求，导致"长尾模型"占用大量资源。Aegaeon通过Token级调度核心创新，在每次生成token后动态切换模型，结合组件复用和显存优化，将模型切换开销降低97%，支持亚秒级响应，单GPU可同时服务多达7个模型，有效吞吐量提升1.5-9倍。

这一突破不仅推动AI行业可持续发展，还入选了被誉为"操作系统奥斯卡"的SOSP会议，核心技术已应用在阿里云百炼平台，有望在云计算和AI领域广泛推广，降低全球算力成本。

相关A股股票：浪潮信息(000977.SZ)、中科曙光(603019.SH)、寒武纪(688256.SH)、科大讯飞(002230.SZ)。

—————— 分享 ——————

网友讨论 12

TechFan：

This is game-changing! 82% reduction means huge cost savings for AI companies.
张工：

阿里云的技术领先，期待国内更多企业采用这种池化方案。
AI_Skeptic：

Sounds impressive, but I need to see real-world data. Is it scalable beyond Alibaba?
CloudGuru：

Token-level scheduling is genius. Could revolutionize how we deploy models in the cloud.
李四：

对中小企业来说，GPU成本降低是好消息，希望快点普及。
InvestorJohn：

Time to buy stocks like 000977.SZ! This news could boost the AI hardware sector.
王五：

终于解决资源浪费了，阿里干得漂亮！期待应用到自动驾驶。
CuriousMind：

How does this compare to NVIDIA's DGX systems? Would love a technical deep dive.
赵六：

GPU用量削减82%，环保又经济，支持绿色AI发展！
RealTalk：

Good step, but let's not forget the energy costs. Overall, a win for efficiency.
EmmaTech：

As a developer, I'm excited about the 97% reduction in switch overhead. Faster responses!
陈七：

阿里云在AI领域不断创新，这次入选顶会实至名归。

阿里云AI突破：GPU用量削减82%

网友讨论 12

热门股票