关闭广告

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者747人阅读


当我们训练人工智能写代码或解数学题时,就像教小孩做作业一样,需要给它很多练习题。但问题来了:有些题目太简单,AI一下就会了;有些题目太难,AI怎么也学不会。更麻烦的是,按照传统方法,不管题目难易,我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间,也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队,在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器",让它能够根据题目难度自动分配练习时间,既不浪费计算资源,又能确保每道题都学得扎实。

研究团队的核心发现是:当前主流的AI训练方法GRPO(组相对策略优化)存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时(要么全对要么全错),系统就收不到有用的学习信号,就像老师看到学生交上来的作业要么全是满分要么全是零分,无法判断学生的真实水平。

为了解决这个问

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杠杆资金流入 北方铜业股价创28年新高

21世纪经济报道 浏览 1630

美媒:狄龙今日将与湖人、雄鹿、独行侠和火箭进行会面

直播吧 浏览 15447

范德芬:我知道我加速后别人很难追上,那一刻只想着必须进球

懂球帝 浏览 729

男子身穿"醋瓶子"跑马拉松成全场"显眼包" 本人回应

极目新闻 浏览 22499

vivo严打“黑公关”:索赔近千万!

互联网那些事 浏览 993

以称打死两名越过加沙地带“黄线”人员

环球网资讯 浏览 714

原来牛仔裙才是春夏最减龄的单品

Yuki时尚酱 浏览 19009

微信支付,为何惹毛多所高校?

市界 浏览 15676

员工被指在直播间低价倒卖他人快递 中通:已报警

每日经济新闻 浏览 73824

长安汽车董事长:行业营销无底线 车子非要说上千万

智车情报局 浏览 12908

前TVB男星直言想生二胎 妻子4年前以52岁高龄诞女

TVB剧评社 浏览 15573

香奈儿光影纪:杜维埃的浪漫银幕

时尚COSMO 浏览 12991

小米SU7车机跑分出炉!不敌奔驰、小鹏,说好的跑分之王呢?

电车通 浏览 10967

世体:拉菲尼亚将坐在替补席额外座位上,为球队提供支持

懂球帝 浏览 879

俄称挫败乌军空降行动

上观新闻 浏览 700

美妆胶卷 | 处处彰显高品质型男的品味格调。

伊周潮流 浏览 12989

马竞官方:巴勃罗-巴里奥斯肌肉轻度损伤

懂球帝 浏览 826

应李强总理邀请 俄罗斯总理时隔半年多再次来华

北京日报客户端-长安街知事 浏览 74093

旅拍这赛道,还得看倪妮

时尚COSMO 浏览 898

泽连斯基又怂恿:中国帮忙很重要 感谢提供帮助的人

澎湃新闻 浏览 4299

媒体:中方对菲船只的行动安排精妙 美想帮忙没理由

直新闻 浏览 14864
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1