分享好友 资讯首页 频道列表

马斯克xAI再发力:Grok 4.1性能飙升,多项测试表现亮眼

2025-11-18 20:4326140

埃隆・马斯克旗下的人工智能公司xAI近日宣布,正式面向所有用户推出其最新大语言模型Grok 4.1。该版本已全面覆盖grok.com平台及iOS、安卓移动应用,旨在提升模型在真实场景中的实用性,为用户提供更智能、更人性化的交互体验。

官方介绍称,Grok 4.1在继承前代模型高可靠性与敏锐智能的基础上,重点优化了创造性、情感理解及协作互动能力。通过改进算法架构,新模型能够更精准捕捉用户意图,生成更具连贯性和吸引力的对话内容,显著增强了人机交互的“人情味”。

在性能测试中,Grok 4.1展现出行业领先水平。其具备深度思考能力的版本(代号quasarflux)在大型语言模型竞技场(LMArena)文本能力排行榜中以1483的Elo分数登顶,领先第二名31分;而“即时响应”版本也以1465分位列第二,甚至超越其他模型的“全推理”模式。这一成绩较前代Grok 4(排名第33位)实现质的飞跃,凸显其底层技术优势。

除通用能力外,Grok 4.1在“软实力”方面同样表现突出。在衡量情商的EQ-Bench3基准测试中,其推理与非推理模式包揽前两名,展现出对情感、洞察力及人际交往的深刻理解;在创意写作领域,Creative Writing v3测试结果显示,两种模式分列第二、第三,仅次早期的GPT-5.1模型,证明其既能处理复杂逻辑,也能进行富有想象力的内容创作。

针对大语言模型常见的“幻觉”问题,xAI在训练后期通过优化信息查询类提示的算法,显著降低了事实性错误率。评估数据显示,Grok 4.1在快速响应场景下提供的信息更可靠、更准确,尤其适合需要实时搜索工具支持的任务,进一步提升了实用价值。

反对 0
举报 0
收藏 0
打赏 0
评论 0
翼菲科技“鸿钧”人形机器人亮相:全向移动身高可调 适配多工种需求
翼菲科技“鸿钧”人形机器人亮相:全向移动身高可调 适配多工种需求

0评论2025-11-181288

卢伟冰透露:小米17系列销售佳,但预计明年汽车毛利率或下滑
卢伟冰透露:小米17系列销售佳,但预计明年汽车毛利率或下滑

0评论2025-11-182274

Arm与英伟达强强联手:NVLink Fusion助力Neoverse平台开启AI新征程
Arm与英伟达强强联手:NVLink Fusion助力Neoverse平台开启AI新征程

0评论2025-11-18988

OpenAI新研究:用稀疏模型解锁大模型“黑箱” 作者多来自Ilya团队
OpenAI新研究:用稀疏模型解锁大模型“黑箱” 作者多来自Ilya团队

0评论2025-11-171545

阿里千问App公测上线,以开源模型为基剑指全球AI to C市场
阿里千问App公测上线,以开源模型为基剑指全球AI to C市场

0评论2025-11-171320

OpenAI发布GPT-5.1:沟通更自然有温度,付费用户可先体验
OpenAI发布GPT-5.1:沟通更自然有温度,付费用户可先体验

0评论2025-11-131632

OpenAI推出GPT-5.1系列:ChatGPT更智能,对话体验升级且风格更多样
OpenAI推出GPT-5.1系列:ChatGPT更智能,对话体验升级且风格更多样

0评论2025-11-13695

原DeepSeek核心成员罗福莉官宣加入小米MiMo团队 疑将发力世界模型与具身智能领域
原DeepSeek核心成员罗福莉官宣加入小米MiMo团队 疑将发力世界模型与具身智能领域

0评论2025-11-132057

AI时代人才评估转型:聚焦能力矩阵,告别“一考定终身”模式
AI时代人才评估转型:聚焦能力矩阵,告别“一考定终身”模式

0评论2025-11-13714

Meta豪掷超10亿美元于威斯康星州建数据中心,为AI“超级智能”目标提前布局算力
Meta豪掷超10亿美元于威斯康星州建数据中心,为AI“超级智能”目标提前布局算力

0评论2025-11-131919