关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者823人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

朝鲜版"死神"无人机发射导弹画面被披露 或已列装部队

澎湃新闻 浏览 87059

大成基金:“高新技术产业股票A”成立8年多收益率260%,最大回撤45.77%

面包财经 浏览 18984

9名巴基斯坦人在伊朗遭不明人员杀害

澎湃新闻 浏览 12564

特朗普下令重启核试验 美官员称暂不含核爆炸

中国国情 浏览 761

中小银行异地展业整改倒计时 跨城存款“最后的疯狂”?

第一财经资讯 浏览 15671

张慧贤指责万鹏“当小三当惯了”万鹏方严正声明

韩小娱 浏览 999

为单一球队效力17年,库里将解锁成就成为联盟历史第七人

懂球帝 浏览 1029

果园8.8元"偷橘子":一晚卖几百斤 抓人的狗都累瘫了

红星新闻 浏览 13322

俄美领导人会晤为何被“推迟” 俄外长披露原因

每日经济新闻 浏览 815

端水大师!邓超两次亮相红毯 陪完孙俪陪鹿晗

网易娱乐 浏览 26937

夏天,有“形”的衣服能弥补身材的不足!

Yuki女人故事 浏览 11419

春季不知道穿什么?参考这24套穿搭示范,舒适、清新、简约

静儿时尚达人 浏览 12584

赵嘉义:穆迪的表现大家有目共睹 杨瀚森非常有天赋

直播吧 浏览 12900

40岁的唐嫣,在《繁花》里的脸怎么变成这样了?

Yuki女人故事 浏览 13130

傅聪团队新作:OnePiece!通用生成式推荐模型新范式

学术头条 浏览 758

推特崩了?马斯克出手:限流!

每日经济新闻 浏览 15635

泰国榴梿出口,中国几乎“包圆”

环球时报国际 浏览 12738

普京警告欧洲勿阻挠和谈:如果欧洲想打 我们准备好了

澎湃新闻 浏览 223

中方再次致函古特雷斯阐明立场 严正批驳日方无理狡辩

环球网资讯 浏览 15341

甲流来袭,“比新冠疼多了”,奥司他韦一盒难求!

证券时报e公司 浏览 19193

又美又飒!90后退役女兵成全国首个消防女飞行员

环球网资讯 浏览 20054
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1