分享好友 资讯首页 频道列表

阿里云重磅出击!Qwen3-Omni等多模态AI模型及工具全新发布

2025-09-27 00:129400

阿里云近日宣布推出三款全新AI模型,涵盖多模态交互、语音合成及图像编辑领域,并同步开放源代码供开发者使用。此次发布的模型包括Qwen3-Omni全模态模型、Qwen3-TTS-Flash语音合成系统,以及Qwen-Image-Edit-2509图像处理工具,标志着其在生成式AI技术上的进一步突破。

作为全球首个原生端到端全模态AI模型,Qwen3-Omni突破了传统多模态系统的技术瓶颈。该模型支持文本、图像、音频、视频的跨模态输入,并可通过自然语音实现实时流式输出。开发者无需在不同模态能力间进行权衡,即可构建支持多类型数据交互的应用程序,为智能客服、内容创作等领域提供更高效的解决方案。

在语音技术领域,Qwen3-TTS-Flash重新定义了文本转语音的标准。该模型支持中、英、意、法四国语言的SOTA级语音识别,提供17种情感化声线选项,并覆盖粤语、闽南语、四川话等9种中国方言。其多语言兼容性与自然度表现,使其成为游戏配音、智能导航、多媒体内容生产等场景的理想选择。

图像处理方面,Qwen-Image-Edit-2509展现了强大的融合编辑能力。用户可上传单张图片进行基础处理,或通过组合“人物+产品”“人物+场景”等元素实现创意合成。模型通过智能算法分析元素特征,自动完成光影匹配与细节优化,生成符合视觉逻辑的融合图像,为电商设计、影视特效等领域提供高效工具。

目前,这三款模型已通过阿里云平台开放下载,开发者可基于开源代码进行二次开发。相关技术文档与使用案例同步上线,用户可通过访问AI资讯平台获取最新动态及行业应用方案。

反对 0
举报 0
收藏 0
打赏 0
评论 0
纽约大学新突破:AI解锁《我的世界》多视角同步建模新能力
纽约大学新突破:AI解锁《我的世界》多视角同步建模新能力

0评论2026-03-011328

一加Ace 6T正式登场:与一加Ace6全面对比,升级亮点在哪?
一加Ace 6T正式登场:与一加Ace6全面对比,升级亮点在哪?

0评论2025-12-122899

艾瑞报告:优酷凭精品内容实现用户与广告双增长 领跑行业
艾瑞报告:优酷凭精品内容实现用户与广告双增长 领跑行业

0评论2025-12-12917

佰维推出Mini SSD CL100:超小体积高性能,配套读卡器RD510同步登场
佰维推出Mini SSD CL100:超小体积高性能,配套读卡器RD510同步登场

0评论2025-12-101345

莲花For Me武汉惊艳亮相,冯擎峰放言:性能超豪车,2026年上市
莲花For Me武汉惊艳亮相,冯擎峰放言:性能超豪车,2026年上市

0评论2025-12-102729

日式板前模式融入中式快餐:烟火气里寻新机,警惕形式陷阱
日式板前模式融入中式快餐:烟火气里寻新机,警惕形式陷阱

0评论2025-12-102492

雷诺与福特签署协议 携手布局欧洲电动车市场 2028年推两款新车
雷诺与福特签署协议 携手布局欧洲电动车市场 2028年推两款新车

0评论2025-12-102621