关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者916人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上新 || 降温了!几套实用保暖穿搭请收好

黎贝卡的异想世界 浏览 909

碧桂园兵临城下

中国企业家杂志 浏览 14908

兴业银行异常涨停操盘者:系福建省属国企,此前已持有该行2.8%股份

澎湃新闻 浏览 12958

间谍入住海景民宿拍军港敏感画面 被民宿店主识破上报

央视新闻客户端 浏览 7283

泰康资产段国圣:AI切入投研赛道,资管行业价值链有望重塑

券商中国 浏览 704

这一天,35岁李沁秒了28岁陈哲远,才知李少红当年的眼光有多绝

温柔娱公子 浏览 1014

《侍神令》亏了6.1亿,沉寂4年,陈坤新片又来了,票房仅3.7万

靠谱电影君 浏览 912

又一位维密天使结婚,“顶峰”相见的爱情太美了

VOGUE中国 浏览 16246

Rain东京塔被偶遇,又高又壮又拉风

缘木不求娱 浏览 12529

中资银行,两大突发!

券商中国 浏览 11178

萧亚轩自曝不生娃原因:弟妹已经帮自己生完了

网易娱乐 浏览 15314

亚马逊史上最惨裁员规模又扩大了:媒体和游戏直播部门新年解雇数百人

华尔街见闻官方 浏览 12494

诺基亚回应vivo暂停德国市场销售:期待谈判

第一财经资讯 浏览 16520

包贝尔自导自演新片定档,看了评论区,才知道他的人脉有多强!

电和影 浏览 12073

现实比《新闻女王》更残酷!TVB内斗不止

金融八卦女 浏览 13064

C位观察 | 张帆:如何把音乐节“天价票”降下来

网易财经智库 浏览 15580

我国新一代人造太阳首次放电,未来能源体系建设又走出新一步

趣看热点 浏览 26209

融创中国境外债重组成功在即,距离完全“上岸”还有多远?

钛媒体APP 浏览 18293

马斯克宣布首例人类大脑芯片植入,为什么是里程碑事件?

都市快报橙柿互动 浏览 12518

司乘天平上的滴滴

远川研究所 浏览 1058

降入20万价格区间 曝廉价版特斯拉即将国产

车质网 浏览 1060
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1