首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

OpenAI語音轉寫工具Whisper被曝存在重大缺陷:會憑空生成大段虛假內容

2024年10月28日 09:22  IT之家  作 者:清源

當地時間 27 日,據美聯社報道,超過十位軟件工程師、開發(fā)人員和學術研究人員稱,OpenAI 的語音轉寫工具 Whisper 存在一個重大缺陷:有時會憑空生成大段甚至整句虛假內容。

這些專家指出,這些生成的文本(IT之家注:業(yè)內通常稱為“AI 幻覺”)可能涉及種族言論、暴力措辭,甚至杜撰的醫(yī)療建議。

專家們認為,這一問題尤其令人擔憂,因為 Whisper 已被廣泛應用于全球多個行業(yè),包括用于翻譯和轉錄訪談內容、生成常見消費科技文本及制作視頻字幕。

更具風險的是,盡管 OpenAI已提醒不應在“高風險領域”使用該工具,但一些醫(yī)療機構仍在匆忙采用基于 Whisper 的工具來記錄醫(yī)生與患者的咨詢記錄。

報道稱,研究人員和工程師在工作中經常遇到 Whisper 的“幻覺”現象,問題的整體規(guī)模尚不清楚。例如,密歇根大學一位研究員在研究公共會議時發(fā)現,在嘗試改進模型前,他所檢查的十份音頻轉錄中,八份含有虛構內容。

一位機器學習工程師透露,在最初分析的超過 100 小時 Whisper 轉錄中,他發(fā)現大約一半的內容存在“幻覺”現象。一位開發(fā)人員進一步指出,在他用 Whisper 生成的 26000 份轉錄中,幾乎每一份都帶有虛構內容。

即便是音質良好的簡短音頻樣本,也未能幸免于這些問題。計算機科學家們的最新研究表明,他們審查的 13000 多段清晰音頻片段中,有 187 段出現了“幻覺”現象。

研究人員認為,這一趨勢意味著,在數百萬條錄音中將可能出現數以萬計的錯誤轉錄。

OpenAI 的發(fā)言人表示,該公司持續(xù)研究如何減少幻覺,并且感謝研究者的發(fā)現,將會在模型更新中采納反饋。

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國電信李峻:只有當人工智能成為公共基礎設施,才能普惠大眾
精彩專題
2024中國算力大會
2024年國際信息通信展
中國信科亮相2024年國際信息通信展
第25屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像