关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1701人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:美国盯上铜、银、煤炭等矿产 下一步或加税

澎湃新闻 浏览 5420

明星家暴致电视剧无法播出 上市公司大晟文化起诉被驳回

证券时报 浏览 12633

海通证券业绩下滑,以回购稳信心同步而行,2023年境内各业务表现平稳

财联社 浏览 12805

小米:汽车营销负责人周钘系因个人和家庭原因离职

财联社 浏览 19078

英媒:英国正考虑对华科技投资限制 已在咨询相关意见

看看新闻Knews 浏览 92771

安东尼怒批菲尔-杰克逊:你坚持打不适合的三角进攻,却又说我毁了战术

懂球帝 浏览 715

余承东:华为没有必要自己下场造车,不会涉及20万价位以下市场

界面新闻 浏览 19442

佟丽娅晒照温柔甜美似少女,笑容迷人如初恋

深剖娱乐圈 浏览 15693

贝克汉姆家闹出大瓜!豪门大戏再添新章

观察鉴娱 浏览 1484

“十四五”身边事|农村电商,物流“链”动致富路

环球网资讯 浏览 1025

黄奕说:我的家庭没有爸爸这个角色

趣看热点 浏览 27290

日澳企图深度捆绑应对“突发事态”

环球时报国际 浏览 12651

“龙茅”上市受捧,有平台加价超5000元! 分析师:不要急于“尝鲜”

金融投资报 浏览 12874

读懂IPO|奥特蛋真有暴利?金添动漫靠情绪价值年入近9亿元,正由经销批发走向零售店

时代周报 浏览 778

加州理工学院起诉苹果博通无线专利侵权可能达成和解

网易科技报道 浏览 14868

为什么有的女人老了也很美?

小陈聊搭配 浏览 17005

"医生里面最会做官的"院长落马 案件更多细节披露

八点健闻 浏览 110756

小插曲,威尔士对比利时的世预赛中有老鼠入场短暂干扰了比赛

懂球帝 浏览 1043

二封奥斯卡影后!艾玛·斯通获得最佳女主角

网易娱乐 浏览 12284

美监管部门:对特斯拉Autopilot长达两年调查即将结束

网易科技报道 浏览 14390

图赫尔:赫内斯真说我在引援上会得到一切?那对他可会是很贵的

直播吧 浏览 13725
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1