关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11417人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

终于我爱的配色开始流行了,她叫美拉德

阿丫的时髦趴 浏览 14841

曼城虐菜之战:18场18胜!哈兰德再冲英超100球 首发曝光

叶青足球世界 浏览 310

今年最火的发型来了 又美又时尚

镜子发型 浏览 16882

接近完工!韩国高调展示国产隐形战机进展

环球网 浏览 26504

阿拉维斯vs西班牙人:德尼斯-苏亚雷斯、阿莱尼亚首发,鲁文-桑切斯、基克-加西亚出战

懂球帝 浏览 765

日媒:乌克兰希望引进日本新干线技术 推动战后重建

参考消息 浏览 15742

孟菲斯灰熊116-110萨克拉门托国王,国王连续15年无缘季后赛

趣看热点 浏览 25618

蔚来公布实习生事件调查报告:因无编制未留用

财经电报快讯 浏览 19002

何晴死因被证实好友透露她手术后曾痛哭 葬礼细节披露

古希腊掌管月桂的神 浏览 3287

美利坚金融核爆:三杀困局与帝国黄昏

浏览 5161

衣品很好的中年女人,今冬都认准这三款服装,简单百搭也不过时

Yuki时尚酱 浏览 13345

关店100家!潘多拉败走中国,营收萎缩至1%,消费者:质量太差

木禾投研 浏览 915

新华社权威快报|我国生成式人工智能用户规模超5亿

新华社 浏览 1005

世体:拉波尔塔率队访问布鲁日,参加接待仪式并漫步市中心

懂球帝 浏览 725

最容易怀孕的姿势,千万别乱来!

Yuki女人故事 浏览 12566

湖人波澜不惊地以14分的优势再次战胜太阳队,内线的优势已经完全体现

趣看热点 浏览 26037

75岁施瓦辛格拎铲子上街修路被赞,却修错了地方

译言 浏览 18964

女子称13岁时被继父强奸 继父称"被冤枉" 警方介入

奔流新闻 浏览 74524

王一博耐克终止合作,坚决维护祖国利益

趣看热点 浏览 25807

男博主曝马思唯易梦玲已分手!

SwagFuck 浏览 19071

“不能停”的年会:有公司拿出2个亿发年终奖,也有人在PPT大会里“坐牢”

蓝鲸财经 浏览 12616
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1