人类可以轻松识别出他们最喜欢的演员在电影中出现或讲话的时刻。然而,计算机视觉系统很难完成这项任务。它具有挑战性,因为外观、面部表情、姿势和光照会随着视频的进展而变化。

最近的一项研究提出了一个新的数据集和基准,用于在未修剪的长视频中检索视听人物。

该数据集包括一组 15 分钟的电影视频,这些视频用人物身份进行了注释。身份与面孔和声音相匹配。开发了一个使用视听线索预测人们身份的双流模型作为基线。

为两项任务引入了基准测试:Seen 和 Seen & Heard。当查询面孔出现在屏幕上或谈话时,它们的目标是检索所有片段。结果表明,新数据集补充了以前仅专注于视觉分析的数据集。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。

文章来源于互联网:未剪辑视频中的视听人物搜索

相关推荐: 智能回收平台创业计划书

人类可以轻松识别出他们最喜欢的演员在电影中出现或讲话的时刻。然而,计算机视觉系统很难完成这项任务。它具有挑战性,因为外观、面部表情、姿势和光照会随着视频的进展而变化。 最近的一项研究提出了一个新的数据集和基准,用于在未修剪的长视频中检索视听人物。 该数据集包括…

作者 2021bo

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注