分享好友 资讯首页 频道列表

延迟低于 0.2 秒!Mistral AI 发布 Voxtral Transcribe 2 语音模型,支持中文实时转录

2026-02-06 00:1017550

法国人工智能初创公司Mistral AI近日宣布推出全新的语音转文字模型系列——Voxtral Transcribe2。这一系列包含两款针对不同应用场景优化的模型,旨在解决语音交互中的高延迟和成本痛点。

其中,最受关注的是名为 Voxtral Realtime 的实时转录模型。该模型拥有4B(40亿)参数规模,采用创新的流式架构。其核心亮点在于极致的响应速度:模型可以在音频输入的瞬间同步进行转录,官方数据显示其转录延迟已被压缩至200ms(0.2秒)以下。这意味着在实时对话或同声传译场景中,用户几乎感受不到处理停顿。为了促进开发者社区的生态建设,Mistral AI已以 Apache2.0协议正式开放了该模型的权重。

另一款模型 Voxtral Mini Transcribe V2 则主打大批量处理与极高性价比。该模型专门为处理长音频设计,单次请求即可支持长达3小时的录音文件。在准确率表现上,Mistral 官方表示该模型已超越了 GPT-4o mini Transcribe 和 Gemini2.5Flash。

在语言支持与成本方面,两款新模型均具备出色的普适性,支持包括中文在内的13种主流语言。定价策略也十分具有竞争力:离线批处理版 API 价格为每分钟0.003美元,而追求极致性能的实时版 API 价格则为每分钟0.006美元。

划重点:

⚡ 极低延迟: Voxtral Realtime 模型将转录延迟降至200ms 以内,支持音频即时转录,且已开源模型权重。

反对 0
举报 0
收藏 0
打赏 0
评论 0
DeepSeek发布多模态大模型技术报告,创新框架突破空间参照瓶颈
DeepSeek发布多模态大模型技术报告,创新框架突破空间参照瓶颈

0评论2026-05-01785

中国AI大模型周调用量骤降:价格、模式与市场变化下的新挑战
中国AI大模型周调用量骤降:价格、模式与市场变化下的新挑战

0评论2026-05-012887

农业AI大模型:赋能种子繁育与品种筛选,开启种业智能新时代
农业AI大模型:赋能种子繁育与品种筛选,开启种业智能新时代

0评论2026-05-01714

贵州借“东数西算”优势 具身智能产业联盟与中试基地共促产业升级
贵州借“东数西算”优势 具身智能产业联盟与中试基地共促产业升级

0评论2026-05-012306

乐道L80:智能电动车“死亡谷”中,能否成为破局“关键牌”?
乐道L80:智能电动车“死亡谷”中,能否成为破局“关键牌”?

0评论2026-05-012374

OpenAI意外“剧透”:GPT-5.5等未发布AI模型现身Codex CLI终端
OpenAI意外“剧透”:GPT-5.5等未发布AI模型现身Codex CLI终端

0评论2026-04-232883

消息称OpenAI拟15亿美元投资一合资企业,发力企业级AI市场
消息称OpenAI拟15亿美元投资一合资企业,发力企业级AI市场

0评论2026-04-232723

阿维塔06T全场景运动轿车上市:21.99万元起
阿维塔06T全场景运动轿车上市:21.99万元起

0评论2026-04-232682

Claude Pro 订阅方案调整:部分新用户或失去 Claude Code 使用权
Claude Pro 订阅方案调整:部分新用户或失去 Claude Code 使用权

0评论2026-04-231392