分享好友 资讯首页 频道列表

JPMorgan研究新发现:优化提问方式,解锁AI回答高可靠性的密码

2026-03-01 01:186660

人工智能助手在回答用户问题时偶尔会出现看似合理却错误的内容,这种现象被形象地称为"幻觉"。J.P.Morgan人工智能研究院的最新研究从全新视角切入,发现通过优化提问方式可以显著降低这类错误的发生概率。该研究团队在arXiv平台发布的论文显示,问题本身的表达方式对AI回答的可靠性具有决定性影响。

研究团队对近37万个真实用户提问展开分析,覆盖13个主流问答数据集。通过构建包含17个维度的语言特征分析体系,研究人员发现问题的结构特征、词汇选择和逻辑表达方式都会直接影响AI的回答质量。这颠覆了传统认知——过去普遍认为AI幻觉主要源于模型缺陷或解码策略问题。

在风险特征识别方面,研究绘制出详细的"问题风险图谱"。模糊性表达被证实为首要风险因素,例如询问"特斯拉相关信息"时,AI可能混淆公司、产品或发明家等不同概念。复杂句式同样构成挑战,包含多层条件从句的问题会使AI难以锁定核心询问点。否定句式则因增加逻辑推理难度,导致AI更容易出现偏差。

有趣的是,某些人类认为困难的语言特征对AI影响较小。研究显示,罕见专业术语、最高级表达等特征,AI反而能够较好处理。这表明人机认知机制存在本质差异,优化交互方式需要针对AI特性进行专门设计。

降低错误概率的有效策略包括:在问题中添加具体约束条件,如明确时间范围、实体属性等;使用"总结""比较"等明确指令动词;提前澄清可能产生歧义的词汇。实验表明,经过优化的问题表述可使AI幻觉发生率降低40%以上。这种改进无需调整模型架构,仅通过改变提问方式即可实现。

不同任务类型呈现差异化风险模式。提取类任务因有明确参考依据,风险最低;选择类任务受干扰项影响,风险居中;需要创造性回答的抽象类任务风险最高,其中44.5%的问题被标记为高风险。值得注意的是,问题长度的影响具有任务依赖性——在抽象任务中,问题越长风险越高;而在提取任务中,长度影响可忽略不计。

语言特征之间存在复杂的相互作用网络。研究将17个特征划分为三大群组:语法复杂度群组(包含句子长度、从句数量等)、语义明确性群组(包含意图清晰度、可回答性等)和模糊性群组(包含多义词、语境缺失等)。其中语法复杂度与风险呈负相关,适度的结构复杂反而能提供更多上下文线索。

风险预测模型展现出强大的泛化能力。通过交叉验证发现,核心风险特征在不同数据集和应用领域均保持稳定关联。这种稳定性为开发通用型问题优化工具奠定了基础,相关模型已能实现70%左右的风险预测准确率。

领域特异性研究带来意外发现。在AI训练数据充足的领域(如计算机科学),专业问题的风险反而低于日常问题;而在训练数据稀缺的领域,专业术语确实会增加回答不确定性。这提示用户需要评估AI对特定领域的熟悉程度,合理调整预期。

基于这些发现,研究团队提出三项实用建议:提问时添加具体限定词,使用明确的指令动词,主动消除潜在歧义。这些策略不仅适用于通用AI助手,也可为专业领域的人机交互提供指导。随着AI技术普及,掌握"提问艺术"正在成为重要的数字素养,简单的表达优化就能显著提升人机协作效率。

反对 0
举报 0
收藏 0
打赏 0
评论 0
OpenAI关停Sora:放弃视频业务,转向企业级市场为上市铺路
OpenAI关停Sora:放弃视频业务,转向企业级市场为上市铺路

0评论2026-03-252760

全球最大主权财富基金拟让AI参与投资决策
全球最大主权财富基金拟让AI参与投资决策

0评论2026-03-251799

iOS 26.4系统更新来袭:AI歌单、失窃保护等多项升级齐登场
iOS 26.4系统更新来袭:AI歌单、失窃保护等多项升级齐登场

0评论2026-03-252635

OpenAI关停Sora:业务重心转移,为新模型腾算力与冲刺IPO铺路
OpenAI关停Sora:业务重心转移,为新模型腾算力与冲刺IPO铺路

0评论2026-03-251087

深圳推进AI服务器产业链发展 打造光伏海上风电储能绿电直连零碳标杆
深圳推进AI服务器产业链发展 打造光伏海上风电储能绿电直连零碳标杆

0评论2026-03-252128

中关村论坛“人工智能主题日”:多领域将发布开源成果与前沿科技新品
中关村论坛“人工智能主题日”:多领域将发布开源成果与前沿科技新品

0评论2026-03-25600

机器人自由出招对打,宇树王兴兴预计未来六个月左右落地
机器人自由出招对打,宇树王兴兴预计未来六个月左右落地

0评论2026-03-25769

AI热潮引爆存储芯片需求,废旧安卓机变身“电子金矿”成新宠
AI热潮引爆存储芯片需求,废旧安卓机变身“电子金矿”成新宠

0评论2026-03-251474

宇树科技王兴兴:未来半年机器人或实现自由出招对打 动作丰富度飙升
宇树科技王兴兴:未来半年机器人或实现自由出招对打 动作丰富度飙升

0评论2026-03-251770

消费新信号:2025年新锐品牌如何借搜索坐标与红蓝海指数破局增长
消费新信号:2025年新锐品牌如何借搜索坐标与红蓝海指数破局增长

0评论2026-03-251469