新研究:新技術(shù)助力人工智能減少“胡謅”
人工智能(AI)中廣泛使用的大語言模型不時(shí)出現(xiàn)的“一本正經(jīng)地胡謅”是其難以克服的問題。近日,英國(guó)牛津大學(xué)研究團(tuán)隊(duì)開發(fā)出一種名為“語義熵”的新方法,有望大幅提升AI回答的可靠性。

5月30日,在瑞士日內(nèi)瓦舉行的2024年“人工智能造福人類全球峰會(huì)” 上,參會(huì)者和一個(gè)用于社會(huì)關(guān)懷的機(jī)器人互動(dòng)。新華社記者連漪攝
大語言模型的“胡謅”在業(yè)界被稱為“幻覺”,牛津大學(xué)計(jì)算機(jī)科學(xué)系的研究人員提出“語義熵”方法試圖解決這一問題。在熱力學(xué)中,熵描述的是系統(tǒng)的混亂或者說不穩(wěn)定程度。這項(xiàng)研究中,熵衡量了大語言模型回答的不確定性,不確定性高意味著大語言模型的回答可能存在虛構(gòu)。
該研究成果已發(fā)表在近期出版的英國(guó)《自然》雜志上。論文中說,如果AI對(duì)同一個(gè)問題,給出了許多語義相似的答案,那說明它對(duì)自己的回答比較有把握;反之,如果答案五花八門,那就意味著AI自己也“心里沒底”,很可能是在“胡謅”。
研究人員利用“語義熵”方法,讓大語言模型對(duì)同一問題生成多個(gè)答案,然后將語義相近的答案聚類,最后根據(jù)聚類結(jié)果計(jì)算熵值。熵值越高,表示大語言模型的回答越不確定。
值得注意的是,這一方法不僅考慮了大語言模型回答的字面差異,更關(guān)注語義層面的一致性。這使得“語義熵”能夠更準(zhǔn)確地識(shí)別AI的“胡謅”,而不會(huì)被表達(dá)方式的多樣性所迷惑。
研究結(jié)果表明,“語義熵”方法在多個(gè)數(shù)據(jù)集和任務(wù)中都表現(xiàn)出色,能有效檢測(cè)大語言模型的錯(cuò)誤回答,并通過拒絕回答不確定的問題來提高整體準(zhǔn)確率。更重要的是,這一方法無需修改AI模型本身,可以直接應(yīng)用于現(xiàn)有的大語言模型。
研究人員說,“語義熵”技術(shù)有望在問答系統(tǒng)、文本生成、機(jī)器翻譯等多個(gè)領(lǐng)域發(fā)揮重要作用,幫助AI生成更可靠、更有價(jià)值的內(nèi)容。這不僅將提升AI在實(shí)際應(yīng)用中的表現(xiàn),也將增強(qiáng)用戶對(duì)AI系統(tǒng)的信任。
責(zé)任編輯:網(wǎng)絡(luò)
下一篇:新型技能人才加速擁抱“智能+技能” 第二屆“一帶一路”國(guó)際技能大賽現(xiàn)場(chǎng)見聞
隨便看看:
- [業(yè)內(nèi)]“全國(guó)科普日―2023青少年汽車無限創(chuàng)意征集活動(dòng)科普校園行”
- [業(yè)內(nèi)]高質(zhì)量推進(jìn)防沙治沙工作
- [業(yè)內(nèi)]地名“上”火星標(biāo)記中國(guó)貢獻(xiàn)
- [業(yè)內(nèi)]拍張CT,看一下5億多年前的化石長(zhǎng)啥樣!
- [業(yè)內(nèi)]新華全媒+|全球首個(gè)5G異網(wǎng)漫游試商用正式啟動(dòng)
- [業(yè)內(nèi)]新技術(shù)讓水下機(jī)器人擁有“觸覺”
- [業(yè)內(nèi)]清華大學(xué)團(tuán)隊(duì)揭示星系外氣體進(jìn)入星系的詳細(xì)過程
- [業(yè)內(nèi)]手機(jī)直連衛(wèi)星,技術(shù)不難但商業(yè)化不易
- [業(yè)內(nèi)]上海智能制造裝備產(chǎn)業(yè)規(guī)模突破千億元
- [業(yè)內(nèi)]新研究揭示龜殼可記錄放射性污染
相關(guān)推薦:
網(wǎng)友評(píng)論:
推薦使用友言、多說、暢言(需備案后使用)等社會(huì)化評(píng)論插件
- 恒小花:AI人工智能如何改變未來科技創(chuàng)新趨勢(shì)
- 機(jī)器人機(jī)器狗無人機(jī)維修技能培訓(xùn)裝調(diào)檢修工技能學(xué)習(xí)全
- 美光深耘中國(guó)市場(chǎng),以科技創(chuàng)新與公益行動(dòng)共筑責(zé)任未來
- 美光芯片賦能6600 ION SSD,以超大容量與
- 英偉達(dá)今日重磅發(fā)布機(jī)器人"新大腦&quo
- 美光半導(dǎo)體高性能 DDR5 DRAM 打破內(nèi)存瓶頸
- 美光半導(dǎo)體 LPDDR5X 內(nèi)存:推動(dòng)移動(dòng)設(shè)備與數(shù)
- 零安裝割草時(shí)代,庫犸Mammotion發(fā)布三目視覺
- 成本直降精度翻倍,先導(dǎo)智能狹縫模頭R2R涂布機(jī)引領(lǐng)
- 萬和空氣能閃耀2025熱泵行業(yè)年會(huì),斬獲四項(xiàng)大獎(jiǎng)榮
- 熱點(diǎn)搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會(huì)
- 《大數(shù)據(jù)平臺(tái)云化改造實(shí)踐指南(2024)》發(fā)布,天
- 覺卿諦語智能科技在全國(guó)12355心理健康大會(huì)上展示
- 當(dāng)好“兩個(gè)稀土基地”建設(shè)主力軍,北方嘉軒永磁電機(jī)大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽庫光伏
- 科技賦能,避震嬰兒車或成為行業(yè)硬通貨
- 龍旗科技進(jìn)軍AI PC市場(chǎng),激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國(guó)·北京創(chuàng)新薈”
- 英偉達(dá)搶占高位,市場(chǎng)急需尋求新機(jī)遇,這三支AI股值





