关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12467人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新年首飞,战味浓!

环球网资讯 浏览 12594

从0比5巴西到2比0巴拉圭!韩国为自己正名

体坛周报 浏览 984

再见美拉德,今年流行的“新高智风”时髦又高级!

LinkFashion 浏览 902

颠覆认知!用这8把“尺子”重新丈量中国餐饮未来!

餐饮老板内参 浏览 1679

NBA战报:猛龙112-101骑士,埃文-莫布利29分

懂球帝 浏览 785

特朗普:内塔尼亚胡执政前景“存在不确定性”

环球网资讯 浏览 1066

苏超,明年有新变化!省政府再做部署!

国是直通车 浏览 923

用AI演戏,Vidu 的三重进化,AI视频从碎片化叙事迈向复杂叙事新阶段

雷峰网 浏览 887

比赛日前瞻:全力以赴力争三分!国足迎来亚洲杯关键一战

懂球帝 浏览 12965

周鸿祎53岁考上清华,攻读博士!

每日经济新闻 浏览 15879

中国信通院首届多样性算力优秀案例评选活动正式启动

网易科技报道 浏览 11189

美国财政部部长耶伦将于7月6日至9日访华

财联社 浏览 93123

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 1975

拆解助贷“六小强”三季报

北京商报 浏览 307

王祖贤隐退真相曝光!王晶坦言两点

妙知 浏览 925

宇树科技更名!正在办理工商变更,已完成首期上市辅导

红星资本局 浏览 911

养老金增速领跑 险资投资版图更新

北京商报 浏览 401

Meta再瘦身 至少60名Instagram技术项目经理被裁

IT之家 浏览 12526

男子身穿"醋瓶子"跑马拉松成全场"显眼包" 本人回应

极目新闻 浏览 22500

刘荷娜晒林志颖合照 笑容灿烂梦回《放羊的星星》

网易娱乐 浏览 19983

哈马斯方面拒绝布林肯访问加沙地带

界面新闻 浏览 12541
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1