日韩电影在线观看完整版免费,4480yy亚洲成年私人影院

新聞頻道行業(yè)資訊企業(yè)動態(tài) 展會報道人物專訪產(chǎn)品新聞政策法規(guī) 技術(shù)前沿研究報告

傳動網(wǎng) > 新聞頻道 > 行業(yè)資訊 > 資訊詳情

中國信通院啟動AI大模型幻覺評測

時間：2025-03-20

來源：電子技術(shù)應(yīng)用

導(dǎo)語：3 月 19 日消息，IT之家從中國信通院官方微信公眾號獲悉，為摸清大模型的幻覺現(xiàn)狀，推動大模型應(yīng)用走深走實，中國信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測評工作，發(fā)起大模型幻覺測試。

　　3 月 19 日消息，IT之家從中國信通院官方微信公眾號獲悉，為摸清大模型的幻覺現(xiàn)狀，推動大模型應(yīng)用走深走實，中國信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測評工作，發(fā)起大模型幻覺測試。

　　大模型幻覺(AI Hallucination)是指模型在生成內(nèi)容或回答問題時，產(chǎn)生了看似合理，實則與用戶輸入不一致(忠實性幻覺)或者不符合事實(事實性幻覺)的內(nèi)容。隨著大模型在醫(yī)療、金融等關(guān)鍵領(lǐng)域廣泛應(yīng)用，大模型幻覺帶來的潛在應(yīng)用風(fēng)險日益加劇，正得到業(yè)界的廣泛關(guān)注。

　　本輪幻覺測試工作將以大語言模型為測試對象，涵蓋了事實性幻覺和忠實性幻覺兩種幻覺類型，具體測評體系如下：

　　測試數(shù)據(jù)包含 7000 余條中文測試樣本，測試形式包括對應(yīng)于忠實性幻覺檢測的信息抽取與知識推理兩類題型，以及對應(yīng)事實性幻覺檢測的事實判別題型?？傮w涉及人文科學(xué)、社會科學(xué)、自然科學(xué)、應(yīng)用科學(xué)和形式科學(xué)五種測試維度。

　　中國信通院邀請各相關(guān)企業(yè)參與模型測評，共同推動大模型安全應(yīng)用。

中傳動網(wǎng)版權(quán)與免責(zé)聲明：

凡本網(wǎng)注明[來源：中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件，版權(quán)均為中國傳動網(wǎng)(www.connectcrack.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”，違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件，均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士，版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者，禁止擅自篡改，違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題，請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。

皮爾磁：氫能的綠色未來：安全技術(shù)的關(guān)鍵角色

氫能是目前為止公認(rèn)的最為清潔的能源之一，氫氣可以燃燒產(chǎn)生熱能，燃燒之后僅產(chǎn)生水不會形成溫室氣體。氫原子可以氧原子結(jié)合，結(jié)合的過程中會發(fā)生電子移動形...

返回新聞首頁