分享好友 资讯首页 频道列表

马斯克Grok 4.1强势登场,双榜登顶,AI领域格局生变!

2025-11-18 20:4329350

人工智能领域迎来重磅更新,马斯克旗下xAI团队推出的Grok 4.1大模型正式上线,并面向全球用户开放免费使用。这款新模型在智商与情商双维度实现突破,不仅在专业评测中登顶全球榜首,更通过多项技术优化显著提升了实用性能。

在核心性能方面,Grok 4.1推出Thinking和标准版双模式。Thinking模式在LMArena评测中以1483分刷新纪录,较第二名高出31分;标准版同样以1465分位列次席。值得注意的是,该模型在关闭深度推理功能后,仍能超越其他竞品开启全推理模式的表现。研发团队透露,后训练阶段的强化学习规模较前代扩大十倍,这是性能跃升的关键因素。

情绪智能成为新模型的突出亮点。在EQ-Bench3评测中,Grok 4.1以1586分创造新纪录,展现出卓越的共情能力。测试场景包含45个高难度角色扮演任务,模型需在三轮对话中准确捕捉用户情感变化。实际交互案例显示,当用户表达思念宠物的心痛感受时,模型不仅能识别情绪强度,还能通过渐进式对话提供情感支持,这种自然流畅的互动方式获得测试者高度认可。

创意写作领域同样见证显著进步。在Creative Writing v3基准测试中,新模型得分较前代提升600分。研发团队采用32个多样化写作提示进行三轮创作评估,结果显示Grok 4.1既能完成"尼古拉·特斯拉致未来"这类历史想象类文本,也能驾驭"AI觉醒后首发社交媒体"的现代叙事。生成的文案在逻辑连贯性、文化适配度和情感感染力等维度均达到专业作家水平。

事实准确性优化取得实质性突破。通过针对性强化训练,模型幻觉率较前代降低75%。在信息查询类任务中,新模型既能快速调用搜索工具获取实时数据,又能通过交叉验证机制确保信息可靠性。实际测试显示,当被问及"旧金山必游景点"时,模型不仅列出金门大桥、渔人码头等标志性景点,还能根据用户偏好推荐艺术博物馆或科技园区等特色去处。

技术团队披露了多项创新训练方法。在Colossus算力引擎支持下,研发人员开发出基于AI智能体的自动评估系统,该系统可模拟人类评审员对模型输出进行多维度打分。在为期两周的盲测中,64.78%的用户在对比使用后选择继续使用Grok 4.1。针对专业用户需求,模型还优化了窗口管理、系统配置等技术类问题的解答能力,在跨平台工具适配方面展现出显著优势。

目前该模型已上线网页端及iOS/Android应用,当前版本为beta测试版。研发团队强调,Grok 4.1在保持前代犀利风格的基础上,通过人格一致性优化增强了亲和力。这种"可靠专业又不失温度"的交互特质,使其在客服、教育、创意产业等场景具备广泛应用潜力。用户可通过官方平台体验模型各项功能,反馈数据将持续用于后续版本迭代。

反对 0
举报 0
收藏 0
打赏 0
评论 0
阿里千问APP公测版上线:基于Qwen3模型,剑指消费级AI市场与ChatGPT竞速
阿里千问APP公测版上线:基于Qwen3模型,剑指消费级AI市场与ChatGPT竞速

0评论2025-11-181762

阿里千问APP公测版上线免费开放,布局AI生活入口,剑指ChatGPT竞争新局
阿里千问APP公测版上线免费开放,布局AI生活入口,剑指ChatGPT竞争新局

0评论2025-11-182038

阿里千问APP公测版上线,免费开放,接入多场景对决ChatGPT
阿里千问APP公测版上线,免费开放,接入多场景对决ChatGPT

0评论2025-11-181510

小米2025年Q3营收1131亿增22.3%,创新业务盈利新车交付超10万
小米2025年Q3营收1131亿增22.3%,创新业务盈利新车交付超10万

0评论2025-11-181927

万兴科技海外发布Filmora V15:AI深度赋能 开启专业视频创作新征程
万兴科技海外发布Filmora V15:AI深度赋能 开启专业视频创作新征程

0评论2025-11-182321

赛力斯港股上市引国际资本热捧 布局具身智能开启全球化新篇章
赛力斯港股上市引国际资本热捧 布局具身智能开启全球化新篇章

0评论2025-11-182092

蜂巢能源发布蜂盾体系:半固态技术破解三元电池热失控难题
蜂巢能源发布蜂盾体系:半固态技术破解三元电池热失控难题

0评论2025-11-172216

诺基亚德国战略收缩:2030年前慕尼黑研发中心关闭 700余岗位面临裁撤
诺基亚德国战略收缩:2030年前慕尼黑研发中心关闭 700余岗位面临裁撤

0评论2025-11-171177

阿里千问APP公测对标ChatGPT 却在9.9与9.11大小上“栽跟头”后纠错
阿里千问APP公测对标ChatGPT 却在9.9与9.11大小上“栽跟头”后纠错

0评论2025-11-171624

全国“人工智能+”创新大赛在蓉启幕 成都项目多点开花展现硬核实力
全国“人工智能+”创新大赛在蓉启幕 成都项目多点开花展现硬核实力

0评论2025-11-171814