聊天机器人胡言乱语?牛津研究人员利用语义熵来识破幻觉
6月24日消息,近年来,人工智能蓬勃发展,聊天机器人等应用逐渐普及,人们可以通过简单的指令从这些聊天机器人(例如ChatGPT)获取信息。然而,这些聊天机器人仍然容易出现“幻觉”问题,即提供错误的答案,有时甚至是危险的信息。
图源Pexels
造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过,牛津大学的研究人员另辟蹊径,在最新出版的《自然》杂志上详细介绍了一种他们新开发的方法,用于检测大型语言模型(LLMs)的“捏造”(即任意生成的不正确信息)问题。
LLM通过在训练数据中寻找特定模式来生成答案。但这种方法并非总是奏效,就像人类能从云朵形状中看到动物一样,AI机器人也可能找到并不存在的模式。然而,人类知道云朵只是形状而已,天上并没有漂浮的巨型大象。LLM则可能将此视为真实的,从而“捏造”出并不存在的新科技和其他虚假信息。

牛津大学的研究人员利用语义熵的概念,通过概率来判断LLM是否出现“幻觉”。语义熵指的是同一个词语拥有多种含义的情况,例如,“desert”可以指沙漠,也可以表示抛弃某人。当LLM使用这类词语时,可能会对表达的含义感到困惑。通过检测语义熵,研究人员旨在判断LLM的输出内容是否存在“幻觉”的可能。
利用语义熵的优势在于无需额外的监督或强化学习,即可快速检测LLM的“幻觉”问题。由于该方法不依赖于特定任务的数据,因此即使LLM面临从未遇到过的新任务,也能加以应用。这将大大提升用户对于LLM的信任感,即使是AI首次遇到某个问题或指令。
研究团队表示:“我们的方法可以帮助用户理解何时需要对LLM的输出保持谨慎,并为原本因不可靠性而受限的LLM应用开辟了新天地。”
如果语义熵被证明是一种有效的“幻觉”检测手段,那么我们可以利用这类工具对人工智能的输出进行双重校验,使其成为更加可靠的伙伴。不过IT之家需要提醒的是,就像人类并非无懈可击一样,即使配备了最先进的错误检测工具,LLM也仍然可能出错。因此,聊天机器人胡言乱语?牛津研究人员利用语义熵来识破幻觉始终对ChatGPT等聊天机器人提供的答案进行仔细核查仍然是明智之举。
【来源:IT之家】
标签: 聊天机器人胡言乱语?牛津研究人员利用语义熵来识破幻觉
相关文章
-
双十一销售排名大揭秘,谁是购物狂欢节的王者?详细阅读
每年的11月11日,都像是一场全民参与的“购物奥运会”,这一天,数以亿计的消费者涌入电商平台,抢购心仪已久的商品,而在这场消费盛宴中,有一个话题总是备...
2026-05-09 5
-
520武大郎,从历史人物到现代文化符号的解读与启示详细阅读
在中国悠久的历史长河中,许多经典人物通过文学作品、戏剧表演以及民间传说被赋予了鲜活的生命力,“武大郎”作为《水浒传》中的重要角色之一,虽然戏份不多,却...
2026-05-09 4
-
项羽姓什么?历史真相与文化解读详细阅读
在中华五千年的历史长河中,无数英雄豪杰留下了浓墨重彩的一笔,而其中,“西楚霸王”项羽无疑是最具传奇色彩的人物之一,他以盖世武功、无双胆略和悲壮结局成为...
2026-05-09 5
-
屋里熬醋的正确方法与科学原理,让生活更健康!详细阅读
在我们的日常生活中,醋是一种不可或缺的调味品,它不仅能为菜肴增添风味,还具有许多意想不到的健康功效,你是否知道,自己在家熬制醋不仅简单易行,还能确保食...
2026-05-09 4
-
揭秘欧阳娜娜的父辈背景,家庭如何塑造一位全能艺人?详细阅读
提到欧阳娜娜,许多人会立刻联想到她那充满活力的舞台表演、甜美的笑容以及多才多艺的形象,作为一名年轻的音乐家、演员和时尚偶像,她在娱乐圈中迅速崭露头角,...
2026-05-09 5
-
马鞭草项链,自然与时尚的完美结合详细阅读
你是否曾想过,一条小小的项链不仅仅是一件饰品,更可以是一段故事、一种情感或一个文化符号?我们要聊的是“马鞭草项链”,它不仅承载了自然之美,还蕴含着深厚...
2026-05-09 4
-
宠物托运全攻略,让毛孩子安全抵达目的地的贴心指南详细阅读
引言:为什么宠物托运需要特别关注?在现代社会,宠物早已成为许多家庭的重要成员,无论是搬家、旅行还是探亲访友,当我们需要带着宠物一起出行时,如何安全、顺...
2026-05-09 6
-
兵临城下狙击手,冷静与精准的艺术详细阅读
在现代战争题材的电影或游戏中,“兵临城下狙击手”总是一个让人印象深刻的角色,他们隐藏在暗处,屏息凝神,等待最佳时机,用一颗子弹改变战局,狙击手并不仅仅...
2026-05-09 5
