关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻972人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

台媒:太平洋岛国瑙鲁宣布与台当局“断交”

CCTV国际时讯 浏览 77230

荣耀最先提出端侧大模型概念 赵明:未来会和网络侧大模型合作

网易科技报道 浏览 15479

股价飙涨市值逼近苹果 谁还能挑战英伟达?

第一财经资讯 浏览 12373

专家:普京此时下令检查太平洋舰队战备情况 绝非偶然

参考消息 浏览 109292

美媒:泽连斯基未拒绝领土问题 要求提供更多细节

环球时报国际 浏览 1520

王嘉尔东京开唱,日本名流圈组团来“团建”?

情感大头说说 浏览 730

上海市委原常委朱芝松被公诉 曾长期从事军品工作

极目新闻 浏览 29420

世界田联公布最佳田赛运动员候选:杜普兰蒂斯在列

懂球帝 浏览 920

SRM理工学院发布:文本到视频生成技术演进图谱

科技行者 浏览 670

阿邦拉霍:安东尼在球场上有点愚蠢,他应为自己的表现感到沮丧

直播吧 浏览 18686

洪都拉斯总统访华第二天 正式申请加入新开发银行

界面新闻 浏览 90209

美陆军部长抵达阿联酋首都 与俄“秘密会谈”

环球网资讯 浏览 410

追星成功!韩素希获宋慧乔送咖啡车应援超开心

笑猫说说 浏览 18272

罗马诺:曼联认为亚特兰大要价过高,因此还未报价霍伊伦德

直播吧 浏览 15643

广汽功臣肖勇让位,埃安、杨龙能否相互成全?

车友观察 浏览 1695

孔蒂:上赛季我们的夺冠出乎意料,这赛季的目标是全力卫冕

懂球帝 浏览 279

中邮人寿再收监管罚单:涉及提供虚假投诉数据报告

面包财经 浏览 13146

除了应对美国断供,华为自研基础软件还为什么

财经十一人官方 浏览 19397

韩国女艺人朴秀莲从楼梯摔落脑死亡去世 年仅29岁

篁竹书 浏览 15853

这也太拉了!库里全场仅14中2&三分9中0,得到9分1板6助

懂球帝 浏览 12399

股权被冻结还被带走调查?王濛工作室发声回应

上游新闻 浏览 14660
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1