聊天机器人胡言乱语?牛津研究人员利用语义熵来识破幻觉
6月24日消息,近年来,人工智能蓬勃发展,聊天机器人等应用逐渐普及,人们可以通过简单的指令从这些聊天机器人(例如ChatGPT)获取信息。然而,这些聊天机器人仍然容易出现“幻觉”问题,即提供错误的答案,有时甚至是危险的信息。
图源Pexels
造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过,牛津大学的研究人员另辟蹊径,在最新出版的《自然》杂志上详细介绍了一种他们新开发的方法,用于检测大型语言模型(LLMs)的“捏造”(即任意生成的不正确信息)问题。
LLM通过在训练数据中寻找特定模式来生成答案。但这种方法并非总是奏效,就像人类能从云朵形状中看到动物一样,AI机器人也可能找到并不存在的模式。然而,人类知道云朵只是形状而已,天上并没有漂浮的巨型大象。LLM则可能将此视为真实的,从而“捏造”出并不存在的新科技和其他虚假信息。

牛津大学的研究人员利用语义熵的概念,通过概率来判断LLM是否出现“幻觉”。语义熵指的是同一个词语拥有多种含义的情况,例如,“desert”可以指沙漠,也可以表示抛弃某人。当LLM使用这类词语时,可能会对表达的含义感到困惑。通过检测语义熵,研究人员旨在判断LLM的输出内容是否存在“幻觉”的可能。
利用语义熵的优势在于无需额外的监督或强化学习,即可快速检测LLM的“幻觉”问题。由于该方法不依赖于特定任务的数据,因此即使LLM面临从未遇到过的新任务,也能加以应用。这将大大提升用户对于LLM的信任感,即使是AI首次遇到某个问题或指令。
研究团队表示:“我们的方法可以帮助用户理解何时需要对LLM的输出保持谨慎,并为原本因不可靠性而受限的LLM应用开辟了新天地。”
如果语义熵被证明是一种有效的“幻觉”检测手段,那么我们可以利用这类工具对人工智能的输出进行双重校验,使其成为更加可靠的伙伴。不过IT之家需要提醒的是,就像人类并非无懈可击一样,即使配备了最先进的错误检测工具,LLM也仍然可能出错。因此,聊天机器人胡言乱语?牛津研究人员利用语义熵来识破幻觉始终对ChatGPT等聊天机器人提供的答案进行仔细核查仍然是明智之举。
【来源:IT之家】
标签: 聊天机器人胡言乱语?牛津研究人员利用语义熵来识破幻觉
相关文章
-
科技与人文关怀,从52岁保姆上吊事件看社会问题背后的深层思考详细阅读
一则令人痛心的新闻引发了广泛关注——一位52岁的保姆因不堪生活重压而选择以极端方式结束自己的生命,这起悲剧不仅让我们对个体命运产生深深的同情,也促使我...
2026-03-24 2
-
探索最好的求职网站,找到你的职业新起点详细阅读
在当今这个快速发展的数字化时代,找工作的方式早已从传统的线下招聘会和报纸广告转移到了线上平台,无论是初入职场的毕业生、寻求转型的职业人士,还是希望提升...
2026-03-24 2
-
探秘封门村,孟非的镜头下,现实与传说交织的神秘之地详细阅读
封门村的神秘面纱提到“封门村”,很多人脑海中会浮现出一幅充满神秘色彩的画面——一个被废弃的小山村、破败的房屋、诡异的传闻,以及无数探险者趋之若鹜的身影...
2026-03-24 3
-
探寻丹田的位置与意义—身体的能量中心详细阅读
在中医理论、气功修炼以及武术训练中,“丹田”是一个经常被提及的概念,它不仅被视为人体的重要穴位,更是许多人追求健康和内在力量的核心所在,对于大多数人来...
2026-03-24 3
-
从清纯美女校花看青春与美的多元定义详细阅读
在我们的生活中,“清纯美女校花”是一个常被提及的话题,无论是校园里的真实人物,还是影视剧中的角色塑造,这个形象总是带着一种特别的吸引力,她可能是一个穿...
2026-03-24 3
-
EXO的成员,从音乐偶像到文化现象,他们如何影响我们的生活?详细阅读
如果你对K-pop稍有了解,EXO”这个名字一定不会陌生,这个由SM娱乐公司在2012年推出的男子组合,不仅在韩国本土掀起了一股热潮,更是在全球范围内...
2026-03-24 4
-
奥黛丽赫本的眼睛—那扇通往灵魂的窗户,如何定义了永恒之美?详细阅读
如果你问起世界上最迷人的双眼属于谁,许多人的脑海中可能会立刻浮现出一个名字:奥黛丽·赫本,她的眼睛,就像夜空中最亮的星星,既温柔又深邃,仿佛能看穿你的...
2026-03-24 5
-
科学解读,阴茎长度的正常范围与健康认知详细阅读
阴茎长度的平均数据根据多项国际医学研究,成年男性的阴茎长度(包括疲软状态和勃起状态)存在一定的范围差异,以下是基于全球大规模调查得出的一些统计数据:疲...
2026-03-24 5
