日本高清中文字幕一区二区三区a-日本高清专区一区二无线-日本高新1区2区3区-日本国产亚洲-操操操综合网-操操久久

生成式AI“幻覺”困境如何破解

2個月前 來源:中國科技網 觀看:19

人工智能(AI)技術正以前所未有的速度發展,生成式AI憑借其驚人的創造力,不斷刷新人們的認知。然而,即便是看似“聰明絕頂”的AI,也難逃“幻覺”的困擾。這里的“幻覺”,指的是AI生成看似合理但實際不準確或虛假的信息。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

英國《自然》雜志網站在1月22日的報道中指出,AI“幻覺”可能會引發嚴重后果,科學家正各出奇招,力求降低其發生率。這些措施包括增加事實核查、對AI進行“腦部掃描”等,以促進AI的健康、高效發展。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

主因是數據模糊Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

各種生成式AI,包括由大語言模型驅動的聊天機器人,常常會編造信息。它們有時會模糊事實與虛構,在看似真實的陳述中夾雜錯誤信息。這既是其創造力的體現,也是其不足之處。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

美國佐治亞理工學院理論計算機科學家桑托什·威姆帕拉解釋稱,大語言模型的設計原理并非輸出準確事實,而是通過模式識別生成答案。其內部復雜的運行機制迄今仍像一個“黑匣子”,人們難以洞悉其推理過程。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

美國加州Vectara公司旨在減少生成式AI的“幻覺”。其聯合創始人阿姆爾·阿瓦達拉表示,在訓練過程中,這些模型會壓縮數萬億個單詞間的關系,隨后通過一個龐大的網絡模型重新展開這些信息。盡管這些模型能夠重構出接近98%的訓練內容,但剩下2%的內容卻會讓其“誤入歧途”,生成不準確或虛假信息。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

導致AI出現“幻覺”的原因多種多樣,其中訓練數據中的模糊性和錯誤是常見因素。也有人認為,即使訓練數據準確無誤,AI也有可能產生“幻覺”。這種現象與某一事實的稀缺程度密切相關。因此,即使經過人類反饋調整過的聊天機器人,也無法完全避免出錯。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

多領域面臨考驗Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

AI的“幻覺”可能會給人們的工作和生活帶來較大影響。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

在新聞領域,大語言模型可能生成虛假新聞事件,擾亂信息傳播秩序,誤導公眾認知。Vectara公司針對文檔內容開展的研究表明,一些聊天機器人編造事實、虛構信息的幾率高達30%。世界經濟論壇發布的《2025年全球風險報告》顯示,錯誤和虛假信息是2025年全球面臨的五大風險之一。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

在法律領域,它可能引用虛構的法律條文和案例。比如,2023年美國律師史蒂文·施瓦茨就因“輕信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在醫學領域,它可能提供錯誤的診斷和治療建議,危及患者生命。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

《自然》在報道中指出,AI“幻覺”在科學參考文獻方面出現錯誤的情況也極為普遍。2024年的一項研究發現,各類聊天機器人在提及參考文獻時的出錯率在30%至90%之間。它們至少會在論文標題、第一作者或發表年份上出現偏差。雖然聊天機器人都帶有警告標簽,提醒用戶對重要信息進行二次核實。但如果用戶對聊天機器人的回復深信不疑,可能會引發一系列問題。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

多舉措減少“幻覺”Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

為進一步提升AI的精確度,科學家正想方設法降低其“幻覺”。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

例如,增加模型訓練參數和訓練時長可有效減少“幻覺”。但這種方法需要付出高昂的計算成本,并可能削弱聊天機器人的其他能力,如機器學習算法對未知數據的預測和處理能力。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

此外,使用更大、更干凈的數據集進行訓練,也是降低AI模型“幻覺”出現的有效途徑。然而,當前可用數據的有限性限制了這一方法的應用。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

檢索增強生成(RAG)技術也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機器人在回復問題前參考給定的可信文本,從而確保回復內容的真實性,以此減少“幻覺”的產生。在醫療和法律等需要嚴格遵循經過驗證的知識的領域,RAG技術備受青睞。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

不過,美國斯坦福大學計算機科學家米拉柯·蘇茲根表示,盡管RAG能提升內容真實性,但其能力有限。蘇茲根團隊的研究表明,一些為法律研究開發的、號稱“無幻覺”的RAG增強模型雖有所改進,但仍存在不足。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

開發者也可以使用一個與AI訓練方式不同的獨立系統,通過網絡搜索對聊天機器人的回復進行事實核查,谷歌的“雙子星”系統便是一個典型例子。該系統提供了“雙重核查響應”功能:內容如果突出顯示為綠色,表示其已通過網絡搜索驗證;內容如果突出顯示為棕色,則表示其為有爭議或不確定的內容。但是,這種方法計算成本高昂且耗時,而且系統仍會產生“幻覺”,因為互聯網上錯誤信息泛濫。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

在去年6月出版的《自然》雜志上,英國牛津大學科學家刊發論文稱,他們利用“語義熵”,通過概率來判斷大語言模型是否出現了“幻覺”。語義熵是信息熵的一種,被用于量化物理系統中所包含的信息量。通過評估AI模型在特定提示詞下生成內容的不確定性,來計算模型的困惑程度,從而為用戶或模型提供警示,提醒其采取必要的循證措施,確保更準確的答案輸出。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

美國卡內基梅隆AI研究人員安迪·鄒采用的方法是在大語言模型回答問題時,繪制其內部計算節點的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計算節點活動模式,可以告訴我們AI模型是在“說真話”,還是在“胡說八道”。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

人工智能(AI)技術正以前所未有的速度發展,生成式AI憑借其驚人的創造力,不斷刷新人們的認知。然而,即便是看似“聰明絕頂”的AI,也難逃“幻覺”的困擾。這里的“幻覺”,指的是AI生成看似合理但實際不準確或虛假的信息。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

英國《自然》雜志網站在1月22日的報道中指出,AI“幻覺”可能會引發嚴重后果,科學家正各出奇招,力求降低其發生率。這些措施包括增加事實核查、對AI進行“腦部掃描”等,以促進AI的健康、高效發展。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

主因是數據模糊Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

各種生成式AI,包括由大語言模型驅動的聊天機器人,常常會編造信息。它們有時會模糊事實與虛構,在看似真實的陳述中夾雜錯誤信息。這既是其創造力的體現,也是其不足之處。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

美國佐治亞理工學院理論計算機科學家桑托什·威姆帕拉解釋稱,大語言模型的設計原理并非輸出準確事實,而是通過模式識別生成答案。其內部復雜的運行機制迄今仍像一個“黑匣子”,人們難以洞悉其推理過程。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

美國加州Vectara公司旨在減少生成式AI的“幻覺”。其聯合創始人阿姆爾·阿瓦達拉表示,在訓練過程中,這些模型會壓縮數萬億個單詞間的關系,隨后通過一個龐大的網絡模型重新展開這些信息。盡管這些模型能夠重構出接近98%的訓練內容,但剩下2%的內容卻會讓其“誤入歧途”,生成不準確或虛假信息。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

導致AI出現“幻覺”的原因多種多樣,其中訓練數據中的模糊性和錯誤是常見因素。也有人認為,即使訓練數據準確無誤,AI也有可能產生“幻覺”。這種現象與某一事實的稀缺程度密切相關。因此,即使經過人類反饋調整過的聊天機器人,也無法完全避免出錯。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

多領域面臨考驗Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

AI的“幻覺”可能會給人們的工作和生活帶來較大影響。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

在新聞領域,大語言模型可能生成虛假新聞事件,擾亂信息傳播秩序,誤導公眾認知。Vectara公司針對文檔內容開展的研究表明,一些聊天機器人編造事實、虛構信息的幾率高達30%。世界經濟論壇發布的《2025年全球風險報告》顯示,錯誤和虛假信息是2025年全球面臨的五大風險之一。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

在法律領域,它可能引用虛構的法律條文和案例。比如,2023年美國律師史蒂文·施瓦茨就因“輕信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在醫學領域,它可能提供錯誤的診斷和治療建議,危及患者生命。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

《自然》在報道中指出,AI“幻覺”在科學參考文獻方面出現錯誤的情況也極為普遍。2024年的一項研究發現,各類聊天機器人在提及參考文獻時的出錯率在30%至90%之間。它們至少會在論文標題、第一作者或發表年份上出現偏差。雖然聊天機器人都帶有警告標簽,提醒用戶對重要信息進行二次核實。但如果用戶對聊天機器人的回復深信不疑,可能會引發一系列問題。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

多舉措減少“幻覺”Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

為進一步提升AI的精確度,科學家正想方設法降低其“幻覺”。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

例如,增加模型訓練參數和訓練時長可有效減少“幻覺”。但這種方法需要付出高昂的計算成本,并可能削弱聊天機器人的其他能力,如機器學習算法對未知數據的預測和處理能力。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

此外,使用更大、更干凈的數據集進行訓練,也是降低AI模型“幻覺”出現的有效途徑。然而,當前可用數據的有限性限制了這一方法的應用。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

檢索增強生成(RAG)技術也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機器人在回復問題前參考給定的可信文本,從而確保回復內容的真實性,以此減少“幻覺”的產生。在醫療和法律等需要嚴格遵循經過驗證的知識的領域,RAG技術備受青睞。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

不過,美國斯坦福大學計算機科學家米拉柯·蘇茲根表示,盡管RAG能提升內容真實性,但其能力有限。蘇茲根團隊的研究表明,一些為法律研究開發的、號稱“無幻覺”的RAG增強模型雖有所改進,但仍存在不足。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

開發者也可以使用一個與AI訓練方式不同的獨立系統,通過網絡搜索對聊天機器人的回復進行事實核查,谷歌的“雙子星”系統便是一個典型例子。該系統提供了“雙重核查響應”功能:內容如果突出顯示為綠色,表示其已通過網絡搜索驗證;內容如果突出顯示為棕色,則表示其為有爭議或不確定的內容。但是,這種方法計算成本高昂且耗時,而且系統仍會產生“幻覺”,因為互聯網上錯誤信息泛濫。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

在去年6月出版的《自然》雜志上,英國牛津大學科學家刊發論文稱,他們利用“語義熵”,通過概率來判斷大語言模型是否出現了“幻覺”。語義熵是信息熵的一種,被用于量化物理系統中所包含的信息量。通過評估AI模型在特定提示詞下生成內容的不確定性,來計算模型的困惑程度,從而為用戶或模型提供警示,提醒其采取必要的循證措施,確保更準確的答案輸出。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

美國卡內基梅隆AI研究人員安迪·鄒采用的方法是在大語言模型回答問題時,繪制其內部計算節點的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計算節點活動模式,可以告訴我們AI模型是在“說真話”,還是在“胡說八道”。Lz3即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://m.020gz.com.cn/news-2-375-0.html生成式AI“幻覺”困境如何破解

聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

上一篇:標記速度、均勻性和多功能性超出以往,新技術可高效標記細胞蛋白質

下一篇:頂夸克遵循狹義相對論通過最強測驗

為你推薦
新京報貝殼財經訊(記者程子姣)1月15日,數據顯示,天貓年貨節期間,魔術演出玩具道具銷量環比上月增長174%,同比去年增長116%。數據還顯示,每年12月開始,淘寶...
01-21
持續跳動的“心臟”、有代謝功能的“肝臟”、會呼吸的“肺”……在巴掌大小的芯片上,先“蓋”出模擬人體環境的“房子”,再向其中引入相...
01-24
  中新社太原1月16日電(記者胡健)“晉祠·唐刻華嚴石經陳列館”16日在山西太原晉祠博物館開館...
01-22
  新華社北京1月31日電(記者鄒多為)據海關統計,2024年我國東北地區進出口達到1.25萬億元,同比增長1.6%,規...
02-01
好消息,2025年杭州家電以舊換新和3C數碼產品購新補貼全面啟動!對個人消費者直接新購12大類家電產品給予15%或者20%立減補貼,最高補貼28000元。對個人消費者購買6000元(含)以下手...
01-21
過去半年,為防治部分地方政府招商“內卷化”,遏制拼優惠、拼“政策洼地”式的政府招商模式,一系列文件、法規密集推出。 “去年8月拼...
01-21
1 月 21 日消息,美國東部時間 20 日中午,特朗普在國會大廈圓形大廳宣誓就任美國第 47 任總統。特朗普隨后發表就職演講,他在一項行政命令中表示,將下令其政府“取消電動...
01-22
1 月 24 日消息,特斯拉今日開啟煥新 Model Y 直播首秀,實車正式亮相,此次主要展示的車色為冰河藍。外觀方面,煥新 Model Y 借鑒了賽博越野旅行車、賽博無人電動車中的設...
01-24
  1、《樹下有片紅房子》陳歡爾和景棲遲在一起了,兩人在打打鬧鬧中沉淀下了深厚的感情,互相陪伴彼此走過了艱難的時光。  2、雖然宋叢先喜歡的陳歡爾,但陳歡爾只是把他當...
02-18
在娛樂圈這個星光燦爛的舞臺上,何炅以其出色的主持能力和溫文爾雅的氣質,贏得了廣大觀眾的喜愛與尊敬。而近期,這位步入半百之年的知名主持人,再次以驚人的身體狀態吸引了公眾的...
02-22
  新華社北京12月18日電 12月18日,《新華每日電訊》發表題為《人均預期78.6歲,如何迎接長壽“新常態”?》的報道。 &emsp...
01-21
  如今在城市的大街小巷,不同類型的口腔治療機構隨處可見。這么多的口腔診所對于消費者而言,是意味著享受更多優質醫療服務呢?還是...
01-21
  宜東鎮中心小學男子足球隊隊員在比賽。學校供圖  2024年12月底,宜東鎮中心小學的同學們在...
01-21
  大眾網記者 司心鵬 報道  4月1日,華為ICT大賽2023—2024全國總決賽成績公布,山東商業職業技術學院云計算技術與應用產業學院學生團隊獲得昇騰AI賽道國賽二等獎2項,計...
01-21
  摘要  【兩周上漲超200元/噸!豆一緣何強勢反彈?】1月23日,豆一主力2505合約盤中最高觸及4069...
01-24
  歷經16載漫長籌備后,這家銀行的上市之路最終未能成真。不久前,隨著廣州銀行撤回發行上市申請,...
01-24
天蝎男和射手女是兩個星座中性格截然不同的代表,他們之間的配對一直備受關注。那么,究竟...
01-22
每個人都有自己的審美觀和喜好,摩羯男也不例外。他們對女生的打扮有著獨特的偏好,下面就...
01-22
關于男生穿搭的幾個小竅門~?一、關于男生穿搭的幾個小竅門~?1、顏色要基礎男生衣服的顏色一定不要是花花綠綠的,要在自己的衣柜里多備一點黑色、白色、灰色這一類的打底,如果覺...
02-12
會議正裝男士穿搭? 40歲男士夏季穿搭商務休閑文化?一、會議正裝男士穿搭?1.西服套裝和西裝套裙,一般搭配淺色、純色或純白色的襯衣,腳下穿簡約款皮鞋,鞋子的顏色與服裝匹配,不要過...
02-17
2月8日消息,據“市象”公眾號消息,京東近期正式推出競價購物玩法“京東指數”,該玩法采用消費者與商家雙方共同競價的模式,形成商品價格的動態交易。接近京東的人士透露,這一新玩...
02-09
2月13日消息,轉轉集團發布春節期間(1月5日-2月5日)旗下平臺二手潮奢商品的交易數據。春節期間,轉轉集團旗下的轉轉APP和紅布林APP二手潮奢商品累計交易量同比增長25%;五線城市的...
02-14
2月27日消息,中國旅游研究院(文化和旅游部數據中心)日前與馬蜂窩聯合召開“旅游目的地發展創新研究合作及成果發布會”,會上發布旅游目的地系列研究首份成果——《中國魅力小城...
03-01
全國兩會期間,全國人大代表、飛鶴乳業董事長冷友斌最關注的領域是“國人精準營養、定制化營養”。 預計到2035年,我國60歲以上人口...
03-09
在全國36個城市(地區)試點近兩年后,2024年12月15日個人養老金制度全面落地。如今該政策已落實“滿月”,除了稅收優惠政策以及金融產品品類擴容外,各金融線上平臺為了滿足客...
01-23
2024年末,一位科技創業者火了。作者 | 王思琪來源 | 投資家(ID:touzijias)2024年末,一位科技創業者火了。2025年初,這位創業者再度爆火。近日,中國科技行業因一位85后年輕人現身《...
01-24
根據外媒的一份新報告,法國外設廠商NACON稱他們預計公司2025/2026財年上半年的銷量將大幅增長,作為增長的其中一個原因,他們認為任天堂Switch 2將在此期間發布,即2...
01-22
著名的主機大戰時代如今失去了懸念,索尼PlayStation在本世代多個方面都拔得頭籌,這并不令人意外。然而,多年來,這兩大巨頭在硬件銷售上竟出現如此巨大的差距,著實出...
02-10
2025年電影春節檔連日來喜報頻傳。據網絡平臺數據,截至昨天22時49分,2025春節檔總票房(含預售)破74億元。數據顯示,今年春節檔在大年初一就創造了新的單日票房和觀影人次紀錄;大年...
02-03
據網絡平臺數據,電影《哪吒之魔童鬧?!酚^影人次(含預售)突破1.60億,超《戰狼2》觀影人次成績,登頂中國影史觀影人次榜!《哪吒2》成中國影史觀影人次冠軍。(總臺央視記者 許盼盼)...
02-09
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕

主站蜘蛛池模板: 午夜美女久久久久爽久久 | 51国产午夜精品免费视频 | 久久亚洲国产欧洲精品一 | 人与禽交免费网站视频 | 成人国产精品毛片 | 天天操天天操天天干 | 色综合久久88 | 日本免费不卡在线一区二区三区 | 天天插天天色 | 激情文学综合丁香 | 一级女性黄 色生活片 | 欧美一级三级在线观看 | 狠狠欧美| 欧美在线黄色 | 欧美一级欧美三级在线观看 | 五月婷婷六月丁香综合 | 日韩久久精品视频 | 久久精品免费看 | 亚洲经典一区二区三区 | 人人做人人爽人人爱秋霞影视 | 日韩激情淫片免费看 | 色综网 | 久久国产综合 | 亚洲三级理论 | 成人国内精品久久久久影院 | 99国内视频| 大胆国模一区二区三区伊人 | 久久久久久久久久免免费精品 | 欧美高清一级 | 欧美精品四虎在线观看 | 狠狠狠色丁香婷婷综合久久88 | 亚洲另类激情综合偷自拍 | 麻豆国产三级在线观看 | 日本色网址 | 四虎影视亚洲精品 | 毛片在线播放网站 | 一卡二卡≡卡四卡亚洲高清 | 日本三级2018亚洲视频 | 天天摸天天碰天天碰 | 四虎影院永久免费观看 | 天天干天天色天天 |