据《金融时报》披露,埃隆·马斯克旗下人工智能企业xAI正全力投入世界模型的研发,与meta、谷歌等科技巨头在构建能够理解并模拟物理环境的人工智能系统领域展开激烈角逐。这种技术突破或将使AI的应用范围从纯数字领域扩展至现实世界。
为加速技术落地,xAI今年夏季从英伟达引入两位顶尖研究员——泽山·帕特尔(Zeeshan Patel)和伊桑·何(Ethan He)。这两位专家在物理环境模拟领域拥有深厚积累,而英伟达凭借其Omniverse平台在该领域占据领先地位。知情人士透露,xAI的世界模型项目不仅聚焦游戏领域,旨在生成高度交互的3D环境,还计划应用于机器人控制系统。
与传统依赖文本训练的大型语言模型不同,世界模型通过分析机器人采集的视频数据和物理交互信息,构建对现实世界的动态理解。这种技术路径可能催生新一代AI工具,其能力将远超当前以ChatGPT为代表的文本生成系统。英伟达方面曾向《金融时报》表示,该技术的潜在市场规模可能接近全球经济总量。
马斯克在社交平台X上确认,xAI计划于2025年底前推出"革命性AI游戏",这与他去年公布的技术路线图保持一致。与此同时,该公司本周发布了经过"重大升级"的图像与视频生成模型,并宣布向公众免费开放使用。不同于OpenAI Sora等现有技术通过模式预测生成视频帧,xAI的新模型被指具备对物理规律的因果推理能力。
为支撑技术发展,xAI正大规模招募专业人才。招聘岗位涵盖图像视频生成工程师(年薪18万至44万美元)和视频游戏导师(时薪45至100美元),后者将指导Grok系统开发AI辅助游戏设计工具。这些举措显示,xAI试图通过构建"全模态AI团队",实现文本、图像、视频和音频的跨领域内容生成。
尽管技术前景广阔,现实挑战依然严峻。开发世界模型需要海量现实世界数据,而数据采集与标注成本高昂。游戏开发商Larian Studios发行主管迈克尔·杜斯本周在X平台发文指出,AI无法解决行业"缺乏领导力与愿景"的核心问题,强调"需要更多值得玩家沉浸的虚拟世界,而非数学优化的游戏循环"。
目前,谷歌、meta等科技公司也在推进类似研究,但尚未实现技术突破。xAI方面未对相关置评请求作出回应。这场关乎AI未来形态的技术竞赛,正将人类对智能系统的想象推向新的维度。