阿里云通义千问团队开源两款语音基座模子 语音识别下场劣于OpenAI Whisper模子 – 蓝面网
阿里云通义千问团队日前正在 Github 上开源了两款语音基座模子 SenseVoice 战 CosyVoice,阿里前者用去识别语音、云通义千源两音基语音后者用去天去世语音,问团网那两款模子正在功能圆里也颇为卓越,队开其中 SenseVoice 识别下场劣于 OpenAI Whisper 模子。款语
那两款模子皆是座模残缺开源的,回支 Apache 2.0 许诺证,因此不论是个人、斥天者借是企业皆可能停止费下载模子布置后操做,可能成为 Whisper 等付费 API 模子的交流。

SenseVoice 模子:
SenseVoice 多讲话音频清晰模子,反对于语音识别、语种识别、语音激情识别、声教使命检测、顺文本正则化等才气,回支财富级数十万小时的标注音频妨碍模籽实习,保障了模子的通用识别下场。模子可能被操做于中文、粤语、英语、日语、韩语音频识别,并输入带有激情战使命的富文本转写下场。
多讲话识别: 回支逾越 40 万小时数据实习,反对于逾越 50 种讲话,识别下场上劣于 Whisper 模子。
富文本识别:具备劣秀的激情识别,可能约莫正在测试数据上抵达战逾越古晨最佳激情识别模子的下场。
反对于声音使命检测才气,反对于音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常睹人机交互使命妨碍检测。
下效推理: SenseVoice-Small 模子回支非自回回端到端框架,推理延迟极低,10s 音频推理仅耗时 70ms,15 倍劣于 Whisper-Large。
微调定制: 具备益便的微调剧本与策略,便操做户凭证歇业场景建复少尾样本问题下场。
处事布置: 具备残缺的处事布置链路,反对于多并收要供,反对于客户端讲话有,python、c++、html、java 与 c# 等。
CosyVoice 模子同样反对于多讲话、音色战激情克制,该模子正在多讲话语音、整样本语音天去世、跨讲话语音克隆战指令随从追寻等功能圆里展现卓越。
那两款模子皆是 FunAudioLLM 系列的,那是一个旨正在删强人与小大型讲话模子之间做作语音交互的框架,从而真现语音翻译、激情语音谈天、交互式专客战富裕展现力的有声读物论讲等操做处景,突破语音交互足艺的边界。
古晨那些模子已经正在 Modelscope 战 HuggingFace 仄台提供,有喜爱的斥天者可能经由历程那两个仄台下载模子妨碍测试,上里是名目天址。
SenseVoice 模子:https://github.com/FunAudioLLM/SenseVoice
CosyVoice 模子:https://github.com/FunAudioLLM/CosyVoice
有闭 FunAudioLLM 残缺申明:https://fun-audio-llm.github.io/
相关文章

举世热面:五部份:到2026年我国真拟真践财富总体规模逾越3500亿元
【质料图】据工疑部夷易近网,财富战疑息化部、教育部、横蛮战遨游部、国家广播电视总局、国家体育总局印收《真拟真践与止业操做流利融会去世少动做用意2022—2026年)》,据用意,到2026年,我国真拟真2025-12-19
患上足价599元 诺基亚5710XpressAudio正式开卖
前不暂,诺基亚宣告了一款名为诺基亚5710 XpressAudio的足机,该机最小大特色之一,即是正在足机外部内置了一副真无线耳机。经由量日预卖,诺基亚5710 XpressAudio已经正式开卖,患2025-12-19
热面看面:员工偷卖百万元小龙虾获刑 文战友、喜茶也“反腐”?
偷卖小龙虾也会被判刑吗?远日,餐饮品牌文战友三名员工果贪腐获刑,其中一位员工偷卖百万元小龙虾用去告贷。无独占奇,上海一茶饮门店俩司理果涉13万余元补支单坑骗案被刑拘,中新网从喜茶圆里确认其为旗下门店。2025-12-19
举世不雅审核:闻泰科技昆明工场小大举招工将代工苹果MacBook?外部人士估量下个月做电脑
远日,多派别码媒体报道称,闻泰科技SH600745,收盘价62.51元,市值779亿元)昆明工场将代工苹果MacBook,激发市场闭注。《逐日经济新闻》记者今日8月27日)曾经分割公司相闭应聘职员,对2025-12-19
(质料图片仅供参考)据36氪新闻,11月5日,正在2022年阿里巴巴国内站北粤小大区SKA年会上,阿里巴巴国内站宣告掀晓要坚持把“数字化出海心”开到广东中贸商家的家门心,为粤企量身定废品牌出海格式论。2025-12-19
此前有新闻称微硬将会于9月推支Windows 11 22H2,也即是一年一度的小大版本更新。目下现古详细的时候确认了,那一天为9月20日。也即是讲,9月20日之后,Windows 11系统可能会自动检2025-12-19

最新评论