关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11410人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国“空天飞机”成功着陆,它与美国X-37B有很大不同

环球网资讯 浏览 18153

范玮琪发文力挺陈建州:我爱我的丈夫

网易娱乐 浏览 16048

美国一核电站发生核废水泄漏事故 官方4个月后才通报

新京报 浏览 115309

衣服想要穿出高级感 这些套路你要知道

In风尚 浏览 19265

中国女足世界杯赛程:7月22日、28日对丹麦海地,8月1日对英格兰

直播吧 浏览 19117

至高享价值48800元限时购车礼 猛士M817 Hero售30.19万

网易汽车 浏览 403

ofo戴威二次创业败走美国,咖啡馆仅剩一家

中国企业家杂志 浏览 12967

白玉兰视后竞争激烈:殷桃海清争锋,赵丽颖会赢?

不八卦会死星人 浏览 19155

蔡依林冰岛泡温泉泳装照流出 胸前黑点网友看傻眼

娱乐的小灶 浏览 19614

请“村长”当副总裁、拿下7000台订单,何小鹏:汇天飞行汽车2026年将量产

时代财经 浏览 1013

年度王炸爽剧,还是烂尾了

独立鱼 浏览 1403

多只基金提前结束募集 年内公募新发呈现头部集中

每日经济新闻 浏览 15546

撬动本地零售 物流企业开直播

北京商报 浏览 12681

科技巨头疯狂投资AI基建,芯片厂商吞了云服务企业的利润?

澎湃新闻 浏览 1024

发生了什么?A股瓜子巨头净利骤降

中国基金报 浏览 14632

越野爱好者有福了,福特烈马正式首发

天天汽车 浏览 12738

再举“价格屠刀”,特斯拉手里还有多少王牌?

华夏时报 浏览 14872

「以演聚力·链动共生」文旅商体展融合专场私董会成功举办!| 2025文创新势力超级私董会

第一财经商业数据中心 浏览 656

股市追捧“雪中行”:哈尔滨热度攀升,冰雪产业概念股持续活跃

第一财经资讯 浏览 13105

重新定义边界,吉利全域安全进入 2.0 时代

网易汽车 浏览 1

梅州众将:不管未来怎样都要打好最后一场,拼出个保级机会

懂球帝 浏览 542
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1