分享好友 资讯首页 频道列表

延迟低于 0.2 秒!Mistral AI 发布 Voxtral Transcribe 2 语音模型,支持中文实时转录

2026-02-06 00:1018100

法国人工智能初创公司Mistral AI近日宣布推出全新的语音转文字模型系列——Voxtral Transcribe2。这一系列包含两款针对不同应用场景优化的模型,旨在解决语音交互中的高延迟和成本痛点。

其中,最受关注的是名为 Voxtral Realtime 的实时转录模型。该模型拥有4B(40亿)参数规模,采用创新的流式架构。其核心亮点在于极致的响应速度:模型可以在音频输入的瞬间同步进行转录,官方数据显示其转录延迟已被压缩至200ms(0.2秒)以下。这意味着在实时对话或同声传译场景中,用户几乎感受不到处理停顿。为了促进开发者社区的生态建设,Mistral AI已以 Apache2.0协议正式开放了该模型的权重。

另一款模型 Voxtral Mini Transcribe V2 则主打大批量处理与极高性价比。该模型专门为处理长音频设计,单次请求即可支持长达3小时的录音文件。在准确率表现上,Mistral 官方表示该模型已超越了 GPT-4o mini Transcribe 和 Gemini2.5Flash。

在语言支持与成本方面,两款新模型均具备出色的普适性,支持包括中文在内的13种主流语言。定价策略也十分具有竞争力:离线批处理版 API 价格为每分钟0.003美元,而追求极致性能的实时版 API 价格则为每分钟0.006美元。

划重点:

⚡ 极低延迟: Voxtral Realtime 模型将转录延迟降至200ms 以内,支持音频即时转录,且已开源模型权重。

反对 0
举报 0
收藏 0
打赏 0
评论 0
DeepSeek急招Agent人才!负责人线上线下齐发力广纳贤才
DeepSeek急招Agent人才!负责人线上线下齐发力广纳贤才

0评论2026-06-231960

Getty Images牵手OpenAI:股价飙升背后,合作能否化解行业挑战?
Getty Images牵手OpenAI:股价飙升背后,合作能否化解行业挑战?

0评论2026-06-232681

马里兰大学等团队:小数据量训练出高效机器人操控系统Guava
马里兰大学等团队:小数据量训练出高效机器人操控系统Guava

0评论2026-06-232672

英伟达发布Halos for Robotics首个人工智能安全系统
英伟达发布Halos for Robotics首个人工智能安全系统

0评论2026-06-231442

Viture Helix工业安全眼镜亮相2026AWE:英伟达XR技术赋能一线作业新体验
Viture Helix工业安全眼镜亮相2026AWE:英伟达XR技术赋能一线作业新体验

0评论2026-06-181542

大和研报:人形机器人投资聚焦机身关节与灵巧手执行器 拓普等企业受关注
大和研报:人形机器人投资聚焦机身关节与灵巧手执行器 拓普等企业受关注

0评论2026-06-182979

贾跃亭FX Navi机器狗亮相:硬件课程搭配,1990美元起年费助力持续进化
贾跃亭FX Navi机器狗亮相:硬件课程搭配,1990美元起年费助力持续进化

0评论2026-06-181372

华纳音乐正式收购Sureel AI:为音乐人构筑版权防火墙
华纳音乐正式收购Sureel AI:为音乐人构筑版权防火墙

0评论2026-06-111227

星动纪元人形机器人“上岗”快递分拣 速度比肩人类已多地交付
星动纪元人形机器人“上岗”快递分拣 速度比肩人类已多地交付

0评论2026-06-111418

伏塔(北京)人工智能科技公司成立 卫蓝新能源等携手布局AI领域
伏塔(北京)人工智能科技公司成立 卫蓝新能源等携手布局AI领域

0评论2026-06-111303