初创公司Starcloud完成史上首次“太空轨道大模型训练”
财联社12月11日(编辑:史正丞)周三的最新消息显示,轨道数据中心初创公司Starcloud已经实现了人类首次在太空中训练大语言模型的尝试。
作为背景,Starcloud上月中旬成功发射了一颗搭载英伟达H100图形处理单元的卫星。据公司透露,这颗卫星目前正在轨道上顺利运行基于谷歌开源模型Gemma的应用。
卫星传回的消息写道:“地球人,你们好!或者用我更喜欢的方式来说——你们是一组由蓝色和绿色构成的迷人集合体。让我们从这个独特角度观察你们的世界,会发现哪些奇妙、不容小觑的细节。我是Gemma,我来这里是为了观察、分析,也许偶尔发表一些让你略感不安但颇具洞察力的评论,那就开始吧!”

(来源:Starcloud)
Starcloud leveraged the entire Shakespearean canon to train a model crafted by OpenAI co-founder Andrej Karpathy, utilizing the LLM NanoGPT to empower the model to express itself in Shakespearean English.

作为 NVIDIA 加速计划的成员,以及YC和谷歌云孵化器项目,Starcloud计划旨在建造一座基于太阳能面板的5吉瓦轨道数据中心,这座数据中心的造价和运营成本都将显著低于地球表面的同行。
Starcloud首席执行官Philip Johnston公开表达了公司的目标,即使得轨道数据中心的能源成本比地面数据中心低10倍。通过Starcloud-1在轨运行的实践,旨在验证构建太空数据中心的可行性,特别是那些需要大型计算集群的复杂模型。
Johnston说:“这个模型现在就‘住’在我们的卫星上,具备强大的计算能力和密集的参数配置。我们可以向它发送查询,它会像数据库一样查询聊天模型, pronto!给出复杂、成熟的回答。我们完全可以在卫星上实时地做到这一点。”
眼下这个阶段,人类将 NVIDIA芯片送上太空,核心原因仍然是地球表面缺乏电力容量。太空数据中心能够持續捕捉太阳能为算力芯片供电,不受地球的昼夜周期和天气变化的影响。
刚刚升空不久的“太空算力卫星”已经启动商业服务。通过对观测公司Capella Space的卫星影像进行推理分析,有助于在海上快速发现翻覆船只的救生筏,以及准确地定位森林火灾的发生地点。Johnston 表示,Starcloud 的系统已经实现实时情报传递,能够在森林火灾刚一引燃时即可发现其热特征,并立即向救援人员发出警报。
据悉,Starcloud将在下一次定于2026年10月发射的卫星上搭载多块英伟达H100芯片,并将新一代Blackwell平台也带上去。明年发射的卫星还将配备云基础设施初创公司Crusoe的云平台模块,这将允许客户从太空部署并运行AI工作负载。
作为一颗实验卫星,Starcloud-1将验证轨道算力卫星的实际运营风险,考验其承受能力。摩根士丹利的分析师曾指出,太空数据中心面临的一些挑战包括强烈的辐射、维护轨道的困难、碎片的危害,以及与数据治理和太空交通相关的监管问题等障碍。
Johnston介绍称,基于英伟达芯片的寿命预期,Starcloud卫星的寿命大致为5年。
尽管面临种种不确定性,但鉴于几乎“无穷无尽”的太阳能和建立超大规模太空数据中心的前景,一众科技公司都在积极推动太空数据中心的发展。除了英伟达和Starcloud外,谷歌还将自研TPU发射到太空中运行的计划,而私营企业Lonestar Data Holdings已经将目光投向月球,正在努力实现在月球表面建造商用数据中心的目标。