关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者708人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄最新核潜艇下水 可搭载“末日鱼雷”

环球网资讯 浏览 736

乌代表团“换将”赴美 佩斯科夫:俄方只和美国谈

每日经济新闻 浏览 292

许绍雄离世,她说,老豆我很想你!但我不会再哭

振华观史 浏览 844

明年一季度利率上限降至20% 消费金融迎来“阵痛期”

21世纪经济报道 浏览 635

Krystal,终于等到你!

时尚COSMO 浏览 262

侯友宜“重启核电”主张掀热议,台媒:其全套能源政见对准经济选民

环球网资讯 浏览 14534

男子吐槽一家医院"收费贵"遭起诉 被判"道歉并赔偿"

封面新闻 浏览 34213

马斯克:特斯拉Optimus机器人将成为“令人难以置信的外科医生”

IT之家 浏览 868

在南海坠毁的美军机比F-35还贵 单价1亿美元

参考消息 浏览 692

贝壳豪掷23亿美元回购,董事长彭永东“花公司钱为自己股票护盘”

财经众议院 浏览 641

有些风格的衣服 只有"肉感"女生穿才惊艳

潮范儿 浏览 16762

伊姐周六热推:电视剧《亦舞之城》;电视剧《时差一万公里》......

伊周潮流 浏览 119

厚外套+半裙=今冬绝美穿搭,巨洋气巨显瘦!

Yuki女人故事 浏览 877

携手华为,“黑马”深蓝的下一程

网易汽车 浏览 10776

中国电商霸榜西班牙,阿里Miravia、Shein、速卖通成购物APP前三

网易科技报道 浏览 19645

清华姚班大神陈立杰,联手00后逆向破局!颠覆50年计算机难题

新智元 浏览 286

乔欣的综艺穿搭,想夸一句“好会穿”

瑞丽网 浏览 19532

江苏一民企悬赏100万跨省征集官员违法线索:收到线索

潇湘晨报 浏览 79133

奔四奔五的女人,建议冬季掌握这些不费力的穿搭,又轻松又显气质

Yuki时尚酱 浏览 13250

美军用军舰发射"战斧"导弹和战机空袭也门胡塞武装

环球网 浏览 12960

韩媒预热安洗莹VS陈雨菲:4强唯1战绩优于女帝之人 第9冠最大阻碍

颜小白的篮球梦 浏览 889
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1