关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者706人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

什么牛仔包 还要大牌抢着出

《买手客buyerkey》 浏览 17219

太阳报:曼联17岁中场思韦茨随一线队训练,被比作佩德里

懂球帝 浏览 1108

夏天的高级感,一定少不了“皇室蓝”

Yuki女人故事 浏览 11406

中国女足战胜韩国女足,获得晋级东京奥运会的入场券

趣看热点 浏览 25848

冬季穿搭最关键的就是“保暖”!参考这16套造型,降温也不怕

静儿时尚达人 浏览 12962

导演王晶在采访说《追虎擒龙》是对《追龙》的延续

趣看热点 浏览 27362

环球:《华尔街日报》造谣中国成惯犯 曾造出国际大谣

环球网资讯 浏览 89063

李彦宏下场做手机:靠音箱起家的小度,有百度撑腰,打得过华为、小米?

时代周报 浏览 18038

生死边缘的新能源车企:烧光百亿、年销量不足千辆

Tech星球 浏览 12778

韩国警方搜查刘亚仁住宅 将以嫌疑人身份对其传唤

网易娱乐 浏览 19644

复旦大学法学院学生在毕业典礼上挥拳打老师 院方通报

复旦大学法学院 浏览 63114

她们说这才是秋天最实用的单品!6种穿法都帮大家总结好了

黎贝卡的异想世界 浏览 753

59岁蒋雯丽现状让人心酸,一代女神也落寞了?

洲洲影视娱评 浏览 653

台海巡艇被目击与大陆海警船"并行"

环球网资讯 浏览 12390

华南理工大学发生车祸致1死1伤 目击者:车头明显受损

封面新闻 浏览 33716

马克龙将再次会见马斯克 谈论特斯拉在法国投资的可能性

IT之家 浏览 16098

8座城市同时亮相,特斯拉赛博越野旅行车开启全国巡展

买车君 浏览 12846

金融业排第二!2022年平均工资出炉,这个行业最高

中国基金报 浏览 18510

美媒探访内蒙古:中国AI的一张“王牌”,藏在这里

观察者网 浏览 81

MIT所长涉嫌图片操纵,《自然》发布关注声明

知识分子 浏览 1528

财政部:1-8月国有企业利润同比下降2.7%

财政部 浏览 1453
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1