2025-12-05 15:54:36
每經(jīng)記者|李宇彤 每經(jīng)編輯|陳俊杰
每經(jīng)北京12月5日電(記者李宇彤)12月5日,火山引擎正式發(fā)布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0),依托Seed混合專家大語言模型架構(gòu)構(gòu)建。
據(jù)官方介紹,2.0版本模型推理能力提升,可以通過深度理解上下文完成精準(zhǔn)識別,上下文整體關(guān)鍵詞召回率提升20%。支持多模態(tài)視覺識別,在聽得懂的同時看得懂,可以通過單圖和多圖等視覺信息輸入提升文字識別精準(zhǔn)度。支持日語、韓語、德語、法語等13種海外語種的識別。并且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等復(fù)雜場景進(jìn)行了升級。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP