分享好友 资讯首页 频道列表

Stability AI推出Stable Audio3:突破硬件限制 长音频实现即时高效生成

2026-05-27 16:2224430

知名人工智能企业Stability AI近日推出新一代音频生成系统Stable Audio3,该系统通过开源部分模型权重的方式向全球开发者开放核心技术。作为基于潜扩散架构的音频创作工具,这款模型在双声道立体声输出质量和实时处理能力方面取得突破性进展,能够满足从音乐制作到影视音效的全场景需求。

技术团队创新性地将语义声学自编码器(SAME)与扩散变换器结合,构建出独特的双模块架构。其中SAME自编码器实现4096倍音频压缩率,将原始音频数据压缩为极简的潜在空间表示,使得模型在消费级硬件上即可完成长篇幅音频的实时生成。这种设计彻底改变了传统音频生成对专业工作站的依赖,个人创作者使用普通笔记本电脑就能完成专业级音乐制作。

该系统的核心优势体现在动态算力分配机制上。通过variable-length技术,模型可根据用户指定的音频时长自动调整计算资源消耗,避免传统固定长度模型造成的算力浪费。测试数据显示,在配备高性能GPU的环境下,生成20秒音频仅需0.62秒,处理380秒完整乐曲也仅耗时1.31秒,渲染效率较前代产品提升超过300%。

训练流程的革新同样值得关注。研发团队采用三阶段渐进式训练策略,使模型在推理阶段摆脱对传统无分类器指导技术的依赖,实现真正的单步前向传播。这种设计不仅加快了生成速度,还显著提升了音频质量的稳定性。目前开放下载的轻量级和中量级模型已登陆Hugging Face平台,面向商业用户的高性能版本则通过授权方式提供。

在功能扩展方面,新模型引入基于内补成像技术的智能编辑模块,支持对生成音频进行精准切片、拼接和效果处理。创作者可以像操作图像编辑软件那样,对音频波形进行可视化修改,这种非破坏性编辑方式为音乐创作带来全新可能。从电子音乐制作到影视后期配音,该系统正在重新定义数字音频创作的工作流程。

反对 0
举报 0
收藏 0
打赏 0
评论 0
西南石油大学南充校区团队匠心打造!智能陪护机器人“小黄”温暖登场
西南石油大学南充校区团队匠心打造!智能陪护机器人“小黄”温暖登场

0评论2026-06-011467

人工智能热潮下金属锡成“香饽饽”:半年涨40%,全球储量或仅够开采15年
人工智能热潮下金属锡成“香饽饽”:半年涨40%,全球储量或仅够开采15年

0评论2026-06-01514

国家能源局力推“人工智能+”能源发展 51个高价值场景引领行业新变革
国家能源局力推“人工智能+”能源发展 51个高价值场景引领行业新变革

0评论2026-06-012250

2026广西中小学人工智能与机器人大赛启幕 千余学子赛场展创新风采
2026广西中小学人工智能与机器人大赛启幕 千余学子赛场展创新风采

0评论2026-05-271279

数字技术助力治理升级 厦门翔安智慧城中村项目7月将全面完工
数字技术助力治理升级 厦门翔安智慧城中村项目7月将全面完工

0评论2026-05-27664

AMD苏姿丰为Zen 7布局:牵手台积电A14工艺 力成FOPLP封装或成亮点
AMD苏姿丰为Zen 7布局:牵手台积电A14工艺 力成FOPLP封装或成亮点

0评论2026-05-271327

OpenAI首席执行官奥特曼:AI发展不会致“工作末日” 人际互动难被替代
OpenAI首席执行官奥特曼:AI发展不会致“工作末日” 人际互动难被替代

0评论2026-05-271599

国家能源局力推51个“人工智能+”能源场景 加速能源智能化跃升发展
国家能源局力推51个“人工智能+”能源场景 加速能源智能化跃升发展

0评论2026-05-272684

龙虾之父开源Skill体检工具:精简描述省成本,让Agent调用更高效
龙虾之父开源Skill体检工具:精简描述省成本,让Agent调用更高效

0评论2026-05-262785