马斯克xAI再发力：Grok 4.1性能飙升，多项测试表现亮眼_AI_

埃隆・马斯克旗下的人工智能公司xAI近日宣布，正式面向所有用户推出其最新大语言模型Grok 4.1。该版本已全面覆盖grok.com平台及iOS、安卓移动应用，旨在提升模型在真实场景中的实用性，为用户提供更智能、更人性化的交互体验。

官方介绍称，Grok 4.1在继承前代模型高可靠性与敏锐智能的基础上，重点优化了创造性、情感理解及协作互动能力。通过改进算法架构，新模型能够更精准捕捉用户意图，生成更具连贯性和吸引力的对话内容，显著增强了人机交互的“人情味”。

在性能测试中，Grok 4.1展现出行业领先水平。其具备深度思考能力的版本（代号quasarflux）在大型语言模型竞技场（LMArena）文本能力排行榜中以1483的Elo分数登顶，领先第二名31分；而“即时响应”版本也以1465分位列第二，甚至超越其他模型的“全推理”模式。这一成绩较前代Grok 4（排名第33位）实现质的飞跃，凸显其底层技术优势。

除通用能力外，Grok 4.1在“软实力”方面同样表现突出。在衡量情商的EQ-Bench3基准测试中，其推理与非推理模式包揽前两名，展现出对情感、洞察力及人际交往的深刻理解；在创意写作领域，Creative Writing v3测试结果显示，两种模式分列第二、第三，仅次早期的GPT-5.1模型，证明其既能处理复杂逻辑，也能进行富有想象力的内容创作。

针对大语言模型常见的“幻觉”问题，xAI在训练后期通过优化信息查询类提示的算法，显著降低了事实性错误率。评估数据显示，Grok 4.1在快速响应场景下提供的信息更可靠、更准确，尤其适合需要实时搜索工具支持的任务，进一步提升了实用价值。