关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者933人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

空客天津第二条总装线投产,称产能提高需联合各方构建更具韧性的供应链

澎湃新闻 浏览 910

揭秘曾经的中国全民内衣品牌造假:股价闪崩

清流Plus 浏览 27060

66岁老汉成拆迁户暴富2年找了5任妻子:不合适就散

奇史殿堂 浏览 99413

韩媒:李在镕悄悄访问中国 没去自家设在中国的工厂

环球时报新闻 浏览 90511

经营分化、债务违约 地方AMC众生相

北京商报 浏览 12715

美5名海军陆战队员在坠机事故中死亡

央视新闻客户端 浏览 12457

中国信通院首届多样性算力优秀案例评选活动正式启动

网易科技报道 浏览 11184

山东金矿火灾起因查明,事故发生前存在多项严重违规

趣看热点 浏览 118375

知名女星私生活的谣言有多离谱?

动物奇奇怪怪 浏览 999

月薪涨150被骂抠门?宁德时代宣布涨薪,回应来了;小米汽车将开放「现车选购」,预计年底前可提;字节联手中兴打造首款豆包助手手机

雷峰网 浏览 280

中国社会科学院发布14项冷门绝学

经济观察报 浏览 1565

整形医生称泰勒·斯威夫特怀孕了

阿废冷眼观察所 浏览 977

印度迎来最重要的一位客人

牛弹琴 浏览 242

马拉多纳生前最后语音曝光遗言内容令人唏嘘

趣看热点 浏览 26172

对话全国政协委员、360集团创始人周鸿祎:理解“人工智能+”

经济观察报 浏览 12407

衬衫怎么穿才更得体?看看这些高级感搭配

Yuki时尚酱 浏览 15189

跨年档12部新片来袭!没有大片全是情怀,55岁古天乐对打71岁成龙

萌神木木 浏览 111

工业设计软件逆势活跃 华大九天等创年内新高

第一财经资讯 浏览 1039

2025款零跑B10车主原音回放 再现调查现场

车质网 浏览 695

董明珠回应直播时被黑粉攻击:敞亮面对,要对自己讲话负责任

Tech星球 浏览 19396

千亿巨头奖励员工21枚黄金键帽 空格键重35克价值近4万

每日经济新闻 浏览 6560
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1