关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻971人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

学者:欧洲想实现核心发展目标 除了中国没有其他选择

澎湃新闻 浏览 4589

最后一搏!沙特2亿镑正式报价萨拉赫,已抵英国谈判,盼3天内敲定

我爱英超 浏览 14438

超450亿元!603906,锂电大单

中国基金报 浏览 405

6位星二代大变样,有人名媛范十足,有人长残了

不八卦会死星人 浏览 12848

拜登:越南邀我访问 还想将关系提升为与中国同等地位

北京日报客户端 浏览 84813

"炫富式举报"女子再发声:收钱局长现是某能源集团董事

上游新闻 浏览 87903

沈伯洋被指到处寻求"保护" 邱毅:"台独"分子们都慌了

环球网资讯 浏览 6300

Lisa个人及大吧账号被炸 杨颖张嘉倪受影响

星姐说娱 浏览 13643

TikTok动员1.7亿用户反击封禁法案 众院电话被打爆

上观新闻 浏览 84686

泽连斯基称俄乌和平协议无简单解决方案 普京发声

每日经济新闻 浏览 215

业内编剧怒斥《偷偷藏不住》!吐槽剧情诱导犯罪

萌神木木 浏览 16461

拉塞尔近10战场均26.2分&三分49.5% 在此之前14.6分&38.3%

直播吧 浏览 12558

“极简风”穿搭才是最有高级感的!

静儿时尚达人 浏览 13558

怒批9人摆烂!穆帅不惧球员造反:你爸一直对你好? 4轮0分非末日

风过乡 浏览 425

夏天不建议大家穿的4种颜色,显肤色暗沉还油腻,看看你有没有?

潮人志Fashion 浏览 11648

李靓蕾律师分享离婚官司内幕:称赞女方内心强大

素素娱乐 浏览 16727

京东系高层大换防

全天候科技 浏览 15955

2024开运怎么穿?6个颜色任选一个迎好运!

日系志Yumi 浏览 13279

年度王炸爽剧,还是烂尾了

独立鱼 浏览 1404

俄外交部召见摩尔多瓦驻俄大使表示抗议

界面新闻 浏览 12608

我和我太奶竟然用的是一个Tony

时尚COSMO 浏览 13585
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1