关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者911人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国今年首场重大主场外交活动后 陕西省长率团出访

政知新媒体 浏览 91366

韩媒曝李俊昊林允儿恋爱,合作新剧前就已交往

网易娱乐 浏览 16159

武契奇:要让全国“几乎彻底解除武装”

参考消息 浏览 18901

罗马诺:拉亚接近和热刺谈妥个人条款,球员对加盟持开放态度

直播吧 浏览 16410

售20万元起,2024款极氪X正式上市

天天汽车 浏览 12450

浙江卫视发文:《中国好声音》暂停播出

网易娱乐 浏览 15254

媒体:指控字节跳动的前员工 或已与美情报部门合作

环球时报国际 浏览 16074

美媒:自焚士兵曾称美军直接参与"屠杀"巴勒斯坦人

环球网资讯 浏览 12593

李霄鹏:国安周中亚冠很辛苦,球迷应该理解球员,对他们宽容一些

懂球帝 浏览 846

美军将领称"解放军计划2027年前统一台湾" 外交部回应

中华人民共和国外交部 浏览 96354

媒体:中美俄同一天都有重大发布 情况罕见

上观新闻 浏览 92890

强一股份IPO:始终稳居首位的大客户,未来是否还能带来丰厚利润

览富财经网 浏览 648

Windhorst:多队对骑士阿伦兴趣浓厚 但阿特金森想留下昔日爱徒

直播吧 浏览 10566

电动车双雄终极PK:比亚迪胜在销量、毛利,特斯拉赢在市值

DearAuto 浏览 12623

离婚四年后再看赵丽颖冯绍峰,答案早已一目了然

手工制作阿歼 浏览 586

俄官宣“末日鱼雷”完成核动力试验

环球网资讯 浏览 753

财报爆表后,“最乐观多头”给了1100美元目标价,预测英伟达还要翻倍!

华尔街见闻官方 浏览 14311

以色列宣布对“费城走廊”实现“完全作战控制”

新华社 浏览 11167

“价格刺客” “好借难还”……共享充电宝能否改变计费机制?|两会热点大家谈

封面新闻 浏览 12549

万亿央企,原董事长被查!

每日经济新闻 浏览 12556

佩德里:我们没参与抗议,开场也静默15秒是出于对同行的尊重

懂球帝 浏览 1001
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1