新研究:新技術(shù)助力人工智能減少“胡謅”
人工智能(AI)中廣泛使用的大語(yǔ)言模型不時(shí)出現(xiàn)的“一本正經(jīng)地胡謅”是其難以克服的問(wèn)題。近日,英國(guó)牛津大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)出一種名為“語(yǔ)義熵”的新方法,有望大幅提升AI回答的可靠性。
5月30日,在瑞士日內(nèi)瓦舉行的2024年“人工智能造福人類全球峰會(huì)” 上,參會(huì)者和一個(gè)用于社會(huì)關(guān)懷的機(jī)器人互動(dòng)。新華社記者連漪攝
大語(yǔ)言模型的“胡謅”在業(yè)界被稱為“幻覺(jué)”,牛津大學(xué)計(jì)算機(jī)科學(xué)系的研究人員提出“語(yǔ)義熵”方法試圖解決這一問(wèn)題。在熱力學(xué)中,熵描述的是系統(tǒng)的混亂或者說(shuō)不穩(wěn)定程度。這項(xiàng)研究中,熵衡量了大語(yǔ)言模型回答的不確定性,不確定性高意味著大語(yǔ)言模型的回答可能存在虛構(gòu)。
該研究成果已發(fā)表在近期出版的英國(guó)《自然》雜志上。論文中說(shuō),如果AI對(duì)同一個(gè)問(wèn)題,給出了許多語(yǔ)義相似的答案,那說(shuō)明它對(duì)自己的回答比較有把握;反之,如果答案五花八門,那就意味著AI自己也“心里沒(méi)底”,很可能是在“胡謅”。
研究人員利用“語(yǔ)義熵”方法,讓大語(yǔ)言模型對(duì)同一問(wèn)題生成多個(gè)答案,然后將語(yǔ)義相近的答案聚類,最后根據(jù)聚類結(jié)果計(jì)算熵值。熵值越高,表示大語(yǔ)言模型的回答越不確定。
值得注意的是,這一方法不僅考慮了大語(yǔ)言模型回答的字面差異,更關(guān)注語(yǔ)義層面的一致性。這使得“語(yǔ)義熵”能夠更準(zhǔn)確地識(shí)別AI的“胡謅”,而不會(huì)被表達(dá)方式的多樣性所迷惑。
研究結(jié)果表明,“語(yǔ)義熵”方法在多個(gè)數(shù)據(jù)集和任務(wù)中都表現(xiàn)出色,能有效檢測(cè)大語(yǔ)言模型的錯(cuò)誤回答,并通過(guò)拒絕回答不確定的問(wèn)題來(lái)提高整體準(zhǔn)確率。更重要的是,這一方法無(wú)需修改AI模型本身,可以直接應(yīng)用于現(xiàn)有的大語(yǔ)言模型。
研究人員說(shuō),“語(yǔ)義熵”技術(shù)有望在問(wèn)答系統(tǒng)、文本生成、機(jī)器翻譯等多個(gè)領(lǐng)域發(fā)揮重要作用,幫助AI生成更可靠、更有價(jià)值的內(nèi)容。這不僅將提升AI在實(shí)際應(yīng)用中的表現(xiàn),也將增強(qiáng)用戶對(duì)AI系統(tǒng)的信任。
下一篇:新型技能人才加速擁抱“智能+技能” 第二屆“一帶一路”國(guó)際技能大賽現(xiàn)場(chǎng)見(jiàn)聞
隨便看看:
- [業(yè)內(nèi)]元宇宙走向現(xiàn)實(shí)
- [業(yè)內(nèi)]薄膜神經(jīng)電極改變大腦監(jiān)測(cè)和刺激方式
- [業(yè)內(nèi)]去年我國(guó)可數(shù)字化交付服務(wù)進(jìn)出口額為3727.1億美元 再創(chuàng)歷
- [業(yè)內(nèi)]我國(guó)發(fā)現(xiàn)全球首個(gè)高山隕石坑
- [業(yè)內(nèi)]中國(guó)代表團(tuán)出席地球觀測(cè)組織2023年會(huì)議周
- [業(yè)內(nèi)]SHEIN領(lǐng)銜廣州獨(dú)角獸榜 科技創(chuàng)新與全球化企業(yè)亮眼
- [業(yè)內(nèi)]科研人員推廣密植精準(zhǔn)調(diào)控技術(shù)促進(jìn)黃淮海玉米高產(chǎn)
- [業(yè)內(nèi)]北京:感受科技樂(lè)趣
- [業(yè)內(nèi)]蘇寧易購(gòu)雙11啟動(dòng)“新家電下鄉(xiāng)”計(jì)劃
- [業(yè)內(nèi)]我國(guó)可再生能源裝機(jī)歷史性超過(guò)煤電
相關(guān)推薦:
網(wǎng)友評(píng)論:
推薦使用友言、多說(shuō)、暢言(需備案后使用)等社會(huì)化評(píng)論插件
- 英偉達(dá)今日重磅發(fā)布機(jī)器人"新大腦&quo
- 美光半導(dǎo)體高性能 DDR5 DRAM 打破內(nèi)存瓶頸
- 美光半導(dǎo)體 LPDDR5X 內(nèi)存:推動(dòng)移動(dòng)設(shè)備與數(shù)
- 零安裝割草時(shí)代,庫(kù)犸Mammotion發(fā)布三目視覺(jué)
- 成本直降精度翻倍,先導(dǎo)智能狹縫模頭R2R涂布機(jī)引領(lǐng)
- 萬(wàn)和空氣能閃耀2025熱泵行業(yè)年會(huì),斬獲四項(xiàng)大獎(jiǎng)榮
- 漢桑科技王斌:“智聲”驅(qū)動(dòng)未來(lái) 加速邁向全球高端音
- 探索 Web3.0:互聯(lián)網(wǎng)的未來(lái)新范式
- 力德動(dòng)力30kw微渦發(fā)電機(jī)成功完成高原考核
- 突破溫度與凈化邊界,美的空氣機(jī)打造舒適生活空間
- 熱點(diǎn)搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會(huì)
- 《大數(shù)據(jù)平臺(tái)云化改造實(shí)踐指南(2024)》發(fā)布,天
- 覺(jué)卿諦語(yǔ)智能科技在全國(guó)12355心理健康大會(huì)上展示
- 當(dāng)好“兩個(gè)稀土基地”建設(shè)主力軍,北方嘉軒永磁電機(jī)大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽(yáng)庫(kù)光伏
- 科技賦能,避震嬰兒車或成為行業(yè)硬通貨
- 龍旗科技進(jìn)軍AI PC市場(chǎng),激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國(guó)·北京創(chuàng)新薈”
- 英偉達(dá)搶占高位,市場(chǎng)急需尋求新機(jī)遇,這三支AI股值