阿里云AI突破:GPU用量削减82%

  • 时间:2025-10-20 08:30
  • 评论:12
近日,阿里云推出的计算池化解决方案"Aegaeon"在AI模型服务领域取得重大进展,该方案通过创新资源管理技术,成功入选顶级学术会议SOSP 2025。Aegaeon系统专注于解决GPU资源浪费问题,利用GPU资源池化打破传统"一个模型绑定一个GPU"的低效模式,大幅提升资源利用率。
在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统服务数十个720亿参数量的大模型时,所需英伟达H20 GPU数量从1192个减至213个,削减比例高达82%。这意味着企业硬件采购成本显著降低,尤其对依赖成千上万张GPU的大型AI服务商至关重要,如动辄节省数百万美元支出。
此前,AI服务中存在严重资源闲置:数据显示,17.7%的GPU算力仅处理1.35%的用户请求,导致"长尾模型"占用大量资源。Aegaeon通过Token级调度核心创新,在每次生成token后动态切换模型,结合组件复用和显存优化,将模型切换开销降低97%,支持亚秒级响应,单GPU可同时服务多达7个模型,有效吞吐量提升1.5-9倍。
这一突破不仅推动AI行业可持续发展,还入选了被誉为"操作系统奥斯卡"的SOSP会议,核心技术已应用在阿里云百炼平台,有望在云计算和AI领域广泛推广,降低全球算力成本。
相关A股股票:浪潮信息(000977.SZ)、中科曙光(603019.SH)、寒武纪(688256.SH)、科大讯飞(002230.SZ)。
—————— 分享 ——————

网友讨论 12

  • TechFan:

    This is game-changing! 82% reduction means huge cost savings for AI companies.

  • 张工:

    阿里云的技术领先,期待国内更多企业采用这种池化方案。

  • AI_Skeptic:

    Sounds impressive, but I need to see real-world data. Is it scalable beyond Alibaba?

  • CloudGuru:

    Token-level scheduling is genius. Could revolutionize how we deploy models in the cloud.

  • 李四:

    对中小企业来说,GPU成本降低是好消息,希望快点普及。

  • InvestorJohn:

    Time to buy stocks like 000977.SZ! This news could boost the AI hardware sector.

  • 王五:

    终于解决资源浪费了,阿里干得漂亮!期待应用到自动驾驶。

  • CuriousMind:

    How does this compare to NVIDIA's DGX systems? Would love a technical deep dive.

  • 赵六:

    GPU用量削减82%,环保又经济,支持绿色AI发展!

  • RealTalk:

    Good step, but let's not forget the energy costs. Overall, a win for efficiency.

  • EmmaTech:

    As a developer, I'm excited about the 97% reduction in switch overhead. Faster responses!

  • 陈七:

    阿里云在AI领域不断创新,这次入选顶会实至名归。

热门股票