关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11416人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

韩国3岁女童被遗弃饿死,DNA检测结果更是震惊所有人

趣看热点 浏览 814801

中美 AI 差距扩大:美国96%的亿万富豪财富来自AI,中国 AI 融资衰退、多只股跌跌不休|钛媒体AGI

钛媒体APP 浏览 12840

台军兵种结构出现大变化 背后的玄机更值得关注

枢密院十号 浏览 15099

台媒:台军志愿役士兵一年提前退伍逾4000人

环球网资讯 浏览 18594

阳光保险,让人们拥有更多的阳光

网易财经 浏览 19027

换装全新设计语言 北京EU8申报图曝光

车质网 浏览 1087

赵又廷父亲赞儿媳高圆圆贴心 透露孙女乖巧懂事

网易娱乐 浏览 26850

中印“建立非军事区”“激怒印度官员”?

环球军事时报 浏览 26587

特朗普"带货"后 丰田澄清:没承诺在美投资100亿美元

环球时报国际 浏览 7293

伍伦盼:泰国队客场保障一切到位,吃得好睡得好训练场地也很好

直播吧 浏览 10938

欧美媒体唱衰福建舰仅6成战力 赖岳谦:他们开心就好

看看新闻Knews 浏览 6821

这些才是普通人都该学的冬季穿搭!不浮夸、不单薄,自然保暖

静儿时尚达人 浏览 123

男子花600与上门女保洁发生关系 事后将她赤裸扔楼道

花点时间 浏览 75634

大衣哥女儿又胖了,穿睡衣上街买烤串,头发油腻没有打理

素素娱乐 浏览 12650

小托马斯:班凯罗不知道自己有多好 他就像一块海绵不断吸收知识

直播吧 浏览 14497

卡瓦哈尔谈国家德比:我们渴望复仇,击败他们意义重大

懂球帝 浏览 900

蔚来手机负责人更换,是因为产品不达预期?

钛媒体APP 浏览 12632

嫦娥五号在月面成功点火起飞,我国首次实现地外天体起飞

趣看热点 浏览 25835

重磅!日产总部大楼被中国企业拿下!

电动知家 浏览 723

《新闻女王2》:权力是女人最好的补品

仙女事件簿 浏览 774

春晚爆火的“AD钙奶姐”,被央视封杀?广告霸屏,是该总结一下了

肆季娱乐 浏览 12778
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1