关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12463人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

极氪启动跨代智驾众筹 24款老车主可低价直升Thor-U

网易汽车 浏览 379

一滴水循环使用3.5次,台积电回应南科厂水情吃紧:营运未受影响

IT之家 浏览 19115

佩斯科夫:"瓦格纳事件"不会对俄军行动造成影响

环球网资讯 浏览 15939

曼奇尼自曝若阿莫林下课其可执教曼联!失业一年,在法国遇到拉爵

罗米的曼联博客 浏览 995

英伟达入股英特尔

北京商报 浏览 1782

马斯克否认非法使用毒品,炮轰爆料媒体:不配当厕纸

网易科技报道 浏览 12535

余承东首次直播忙着给智界问界带货,称华为智驾体验优于特斯拉

界面新闻 浏览 11002

薇娅道歉是什么原因引起的?昨晚直播没控制好情绪哭了....

趣看热点 浏览 26768

江苏省副省长王晖履新住建部 负责乡村振兴等方面工作

北京日报客户端-长安街知事 浏览 88316

泽连斯基又怂恿:中国帮忙很重要 感谢提供帮助的人

澎湃新闻 浏览 4299

余承东称问界不会涉及20万元以下市场,要先帮车企卖100万台车

Tech星球 浏览 19186

加里-麦卡利斯特:林德斯是纯粹的足球人;杰拉德还会再执教

懂球帝 浏览 712

曹操碰了2个不该碰的女人!代价惨痛害死1儿1侄1猛将

趣看热点 浏览 26218

11国将承认巴勒斯坦国之际 美国追加60亿美元对以军售

界面新闻 浏览 17770

又一家汽车巨头发生数据泄露 周鸿祎称新能源车是烧数据

汽车专业网 浏览 12242

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 11743

吴孟达胞弟接受专访,哥哥和周星驰的关系一直很要好

趣看热点 浏览 26009

程强:缩量反弹,关注宏观事件密集落地

首席经济学家论坛 浏览 921

你也很铁!波杰姆斯基11中2&三分8中1 得到5分8篮板4助攻

直播吧 浏览 12672

印度电动汽车市场:名爵份额逼近塔塔

车质网 浏览 1029

小马智行第七代 Robotaxi 自动驾驶出租车正式投运,成本下降70%

IT之家 浏览 722
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1