关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1695人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

史上最强财报背后,苹果仍差临门一脚

虎嗅APP 浏览 746

69岁肯尼迪家族成员受美国选民追捧:3年前投票给拜登

红星新闻 浏览 75082

这一夜,龚俊不再吃香,被46岁的男配惊艳

温柔娱公子 浏览 813

阿齐兹:没首发因刚刚伤愈 球队整体表现还不错

直播吧 浏览 18477

太离谱!侃爷花611万定制钢牙,效果超差,像糊了一层劣质锡箔纸

文艺圈娱乐号 浏览 12950

美股反弹!纳指收涨2.21%,黄金、白银期货飙涨创历史新高

中新经纬 浏览 1017

看来看去,还是“极简风”穿搭最有高级感!

静儿时尚达人 浏览 13449

菲近期屡次制造摩擦 美媒称中菲海警热线电话已停

环球网资讯 浏览 14863

尤文啃下硬骨头 斯帕莱蒂拿到“最重要的胜利”

体坛周报 浏览 0

唯一参展的中国品牌,为何能在东京车展被“挤爆”?

道哥说车 浏览 787

MIT最新发现:这十年,算法进步被高估了

机器之心Pro 浏览 92

众泰还魂?追觅新车实车照曝光:一比一复刻宾利添越

三言科技 浏览 921

人过五十别瞎穿!少碰花衣和紧身裤,这样穿才叫越老越有味道

静儿时尚达人 浏览 904

高市为当首相对维新会大幅让步 接受其数个"绝对条件"

极目新闻 浏览 6073

中菲磋商南海问题 中方还就涉台问题提出严正交涉

新京报 浏览 78798

腾讯首次系统披露研发进展:AI生成50%新增代码,研发自动化水平同比提升67%

华尔街见闻官方 浏览 873

马航MH370重启搜索方案披露 囊括未探及新区域

红星新闻 浏览 84488

莫雷诺晒与曹赟定合影:很高兴再次见面,祝你取得巨大成功

直播吧 浏览 19065

美国陆军法律顾问:请问对华鹰派 你们还有没有良知

环球网资讯 浏览 84227

四大煤炭:中国神华、兖矿能源、陕西煤业、中煤能源,含金量谁高

长风价值掘金 浏览 11182

股票涨停 360三季度净利润同比扭亏为盈

中国经营报 浏览 743
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1