关闭广告

抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT4o

量子位1064人阅读

SAIL-VL2团队 投稿
量子位 | 公众号 QbitAI

2B模型在多个基准位列4B参数以下开源第一。

抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2

SAIL-VL2以2B、8B等中小参数规模,在106个数据集实现性能突破,尤其在MMMU、MathVista等复杂推理基准超越同规模模型,甚至比肩更大参数的闭源模型。



方法上,SAIL-VL2通过数据、训练、架构三大维度的创新,为社区提供“小模型也能有强能力”新范式。

SAIL-VL2既具备细粒度视觉感知能力,又能在复杂推理任务中媲美更大规模模型。同时,团队通过开源模型与推理代码,提供可扩展的多模态基础模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

瞭望·瞭望访谈 | 加强空间应用 建设航天强国——专访中国工程院院士戚发轫

新华社 浏览 11279

清华大学推出RLinf-VLA:让机器人在虚拟世界中自学成才的新框架

科技行者 浏览 666

男子开金店第1年卖了1000万:大专毕业 曾月入3000元

中国新闻周刊 浏览 81703

年中发布/细节升级 新款高尔夫R官方谍照来了

一猫说车 浏览 12439

融创中国境外债重组成功在即,距离完全“上岸”还有多远?

钛媒体APP 浏览 18286

苹果股价创历史新高

都市快报橙柿互动 浏览 991

马航MH370失联10周年 英媒抛新证据:机长曾迷恋两姐妹

北美省钱快报 浏览 84470

美媒:中国技术突破极限 42条输电线路全都碾压美国

澎湃新闻 浏览 1026

拜登:英美空袭也门胡塞武装系回应其袭击国际船只

界面新闻 浏览 12472

4、50岁的爱美女人,冬季请收下这些高级的穿搭公式,优雅抬气质

Yuki时尚酱 浏览 13289

孔蒂:上赛季我们的夺冠出乎意料,这赛季的目标是全力卫冕

懂球帝 浏览 277

以色列宣布对“费城走廊”实现“完全作战控制”

新华社 浏览 11164

卫星通信+第二代青海湖电池 荣耀Magic6发布 售价4399元起

网易科技 浏览 12830

媒体:美国曾用F-15击落自家MQ-9"死神"无人机

极目新闻 浏览 19306

克洛普:我不在意阿诺德说的话;瓜迪奥拉是世界上最好的教练

懂球帝 浏览 12277

事关国家和你我,安全、安全还是安全!

牛弹琴 浏览 14637

房贷利率率先跳水 美国楼市或迎来新一轮上行周期

火星宏观 浏览 13041

官方:湖人裁掉RJ-戴维斯、安东-沃特森等4人

懂球帝 浏览 961

《17号音乐仓库》治好了我的假期综合症

八卦三缺一 浏览 12469

为汪小菲、李子柒代工,这钱也不好赚

中国企业家杂志 浏览 19538

74岁刘銮雄罕见露面,穿睡衣出行气场全开,逛国产车店当场下单

扒虾侃娱 浏览 1072
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1