首页 > 活动线报 > 每日福利 > 如何减少AI“一本正经地胡诌”?新方法出现了

如何减少AI“一本正经地胡诌”?新方法出现了

发布时间:2024-06-25 16:51:54来源: 15210273549

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

每日福利更多>>

也来凑热闹 微软游戏部门负责人谈Xbox掌机 苹果更新Mac/iPad版Final Cut Pro视频编辑应用 新能源大5座SUV,颜值与性能融合,顶配不到17万,解读零跑C10 3个全新车+4个大改款!小鹏新车规划公布,增程大SUV最值得等 聊聊几款500元上下的二手显卡,预算有限首选 腾讯2024年三季报,游戏重回增长 顺利验收!长虹虹信软件携手合作伙伴拥抱“数字经济”时代 《AIGC文图学》深入浅出讲解人工智能新技术 双11直播带货消费调查报告:受访者更期待监管、立法和平台出手 每天直播超10万场!广州网店铺数、直播场次、主播数量均领跑全国 京东科技申请液冷散热装置和服务器专利,大大提高装置安全性和可靠性 降税费促交易!楼市有望见底企稳,房地产板块集体高开 荣耀“降价王”:突降2747元,1/1.12英寸大底+5450mAh+IP68 吉宝与诺基亚签署谅解备忘录,合作设计与建造AI数据中心 手游玩家如何拯救游戏沉浸感?iQOO 13都替你想好了 价格真香体验佳,华为nova 13系列成为年度5G手机新宠 OPPO开发者大会:ColorOS 15发布,AI技术更近一步 3.599万欧元起售,最高续航605km,全新欧规版起亚EV3正式上市 重点升级第二排座椅 2025款别克世纪能否助其突破销量低谷? 比亚迪宣布进军韩国乘用车市场 iOS版谷歌Chrome浏览器再升级:购物洞察、增强Lens等 戴尔:CIO应当注意这五个IT基础架构的关键趋势 高配16.58万,配8295芯片,轴距2825mm,聊聊零跑C10增程版 中升集团或分销问界新车,多家证券机构上调目标股价 手机性能处理器,骁龙4-6-7-8系列性能差距巨大 21格力MTN001交易量0.1000亿元,最新收益率1.9803% 常州普渡取得适于无人驾驶的仓库货物转运车专利,节省了人力进而增加上料便捷性 进击双11|开环带货为各电商平台带来增量 B站“双11”为全行业带去新客率均超50% 真我GT7 Pro性能参数大揭秘,是否值得购买? 传华为即将发布纯血鸿蒙平板 纯血鸿蒙PC也在筹备中