近日,阿里云推出的计算池化解决方案"Aegaeon"在AI模型服务领域取得重大进展,该方案通过创新资源管理技术,成功入选顶级学术会议SOSP 2025。Aegaeon系统专注于解决GPU资源浪费问题,利用GPU资源池化打破传统"一个模型绑定一个GPU"的低效模式,大幅提升资源利用率。
在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统服务数十个720亿参数量的大模型时,所需英伟达H20 GPU数量从1192个减至213个,削减比例高达82%。这意味着企业硬件采购成本显著降低,尤其对依赖成千上万张GPU的大型AI服务商至关重要,如动辄节省数百万美元支出。
此前,AI服务中存在严重资源闲置:数据显示,17.7%的GPU算力仅处理1.35%的用户请求,导致"长尾模型"占用大量资源。Aegaeon通过Token级调度核心创新,在每次生成token后动态切换模型,结合组件复用和显存优化,将模型切换开销降低97%,支持亚秒级响应,单GPU可同时服务多达7个模型,有效吞吐量提升1.5-9倍。
这一突破不仅推动AI行业可持续发展,还入选了被誉为"操作系统奥斯卡"的SOSP会议,核心技术已应用在阿里云百炼平台,有望在云计算和AI领域广泛推广,降低全球算力成本。
网友讨论 12
TechFan:
This is game-changing! 82% reduction means huge cost savings for AI companies.
张工:
阿里云的技术领先,期待国内更多企业采用这种池化方案。
AI_Skeptic:
Sounds impressive, but I need to see real-world data. Is it scalable beyond Alibaba?
CloudGuru:
Token-level scheduling is genius. Could revolutionize how we deploy models in the cloud.
李四:
对中小企业来说,GPU成本降低是好消息,希望快点普及。
InvestorJohn:
Time to buy stocks like 000977.SZ! This news could boost the AI hardware sector.
王五:
终于解决资源浪费了,阿里干得漂亮!期待应用到自动驾驶。
CuriousMind:
How does this compare to NVIDIA's DGX systems? Would love a technical deep dive.
赵六:
GPU用量削减82%,环保又经济,支持绿色AI发展!
RealTalk:
Good step, but let's not forget the energy costs. Overall, a win for efficiency.
EmmaTech:
As a developer, I'm excited about the 97% reduction in switch overhead. Faster responses!
陈七:
阿里云在AI领域不断创新,这次入选顶会实至名归。