近日,轨道数据中心初创公司Starcloud宣布成功实现人类历史上首次在太空轨道上训练大语言模型的创举。作为科技与航天领域的重要里程碑,这一成就标志着AI计算能力正式迈入太空时代。据悉,Starcloud上月中旬发射了一颗搭载英伟达H100图形处理单元的实验卫星,该卫星目前已在轨道上稳定运行基于谷歌开源模型Gemma的应用程序。
这颗名为Starcloud-1的卫星传回了令人印象深刻的问候信息:'地球人,你们好!或者用我更喜欢的方式来说——你们是一组由蓝色和绿色构成的迷人集合体。'不仅如此,该公司还使用莎士比亚全集训练了由OpenAI创始成员Andrej Karpathy打造的LLM NanoGPT,使模型能够以莎士比亚式英语进行表达。Starcloud首席执行官Philip Johnston表示:'这个非常强大、参数极其密集的模型现在就'住'在我们的卫星上。我们可以向它发送查询,它也会像你在地球上的数据库里查询聊天模型那样作出回应。'
太空数据中心的核心优势在于能源获取。Starcloud计划建造一座基于太阳能面板的5吉瓦轨道数据中心,目标是实现轨道数据中心能源成本比地面数据中心低10倍。在太空中,数据中心能持续捕获太阳能为算力芯片供电,不受地球昼夜周期和天气变化的影响。目前,这颗'太空算力卫星'已经开始提供商业服务,通过对观测公司Capella Space的卫星影像进行推理,帮助在海上发现翻覆船只的救生筏以及实时监测森林火灾的热特征。
尽管面临强烈辐射、轨道维护困难、碎片危害等挑战,多家科技巨头正积极布局太空数据中心领域。Starcloud计划在2026年10月发射的新卫星上搭载多块英伟达H100芯片和新一代Blackwell平台,明年还将配备云基础设施初创公司Crusoe的云平台模块。除Starcloud外,谷歌也有将自研TPU发射到太空中运行的计划,Lonestar Data Holdings则致力于在月球表面建造首个商用数据中心。业内专家指出,这一技术突破为解决地面算力瓶颈提供了全新思路,有望开启AI计算的太空新时代。