北邮、南洋理工推沙雕视频数据集FunQA 用算法学习喜剧
要点:
1.FunQA是一个包含4365个反直觉视频和312万个文本问答的新数据集。
2.FunQA包含3个子集:幽默视频HumorQA、创意视频CreativeQA和魔术视频MagicQA。
3.FunQA设计了时间戳定位、详细描述、反直觉推理等任务,对模型的理解力提出深入挑战。
来自北京邮电大学、新加坡南洋理工大学及艾伦人工智能研究所的学者们提出了FunQA,一个全新的高质量视频问答数据集,用于测试和提高AI模型对反直觉视频内容的理解能力。
论文地址:https://arxiv.org/abs/2306.14899
FunQA包含总时长近24小时、来自3种反直觉艺术类型的4365个短视频,以及312万条人工注释的视频问答对。它由3个子集组成:幽默视频集HumorQA、创意视频集CreativeQA和魔术视频集MagicQA。这些具有反直觉特点的视频可以对模型的理解力产生深入的挑战。
项目地址:https://funqa-benchmark.github.io/
与现有视频QA数据集相比,FunQA有以下特点:
1. 专注反直觉领域,测试模型对非常规事件的理解力。
2. annotation丰富,每个问答平均34词,远超其他数据集。
3. 创新探索幽默感理解,需要模型学习幽默原理。
4. 强调深度时空推理,如通过常识判断幽默反差。
5. 设计了时间戳定位、详细描述、反直觉推理等任务考察模型的视觉编码、语义表达和逻辑推理能力。
FunQA的具体组成如下:
1. HumorQA:来自脱口秀和模仿秀的1335个幽默视频。
2. CreativeQA:来自创意短视频平台的1465个反常识创意视频。
3. MagicQA:来自网络平台的1565个难以理解的魔术视频。
针对每个子集,FunQA设计了3个核心任务:
1. 反直觉时间戳定位:找到视频中关键反直觉事件的时间点。
2. 详细视频描述:用语句描述视频内容。
3. 反直觉推理:解释视频中反直觉的原因。
此外还有视频标题生成等扩展任务。
在多个模型上进行测试表明,当前模型在FunQA任务上的表现普遍不佳,关键原因包括:
1. 难以准确理解长视频内容和上下文信息。
2. 缺乏推理“常识”,无法理解违反直觉的内容。
3. 不同类型视频的理解能力差异很大。
4. 评估指标不足,难以测量深度理解。
研究者因此提出,后续工作可以从提升模型大小、改进数据质量、优化训练策略等方面入手,以提高模型在FunQA任务上的表现。总体而言,FunQA提供了一个全新且富有挑战的视频理解基准,可以推动计算机视觉研究的发展。
AI地图搜索工具Chatmap AI 描述性短语也能找到地方
ChatMap-AI是一款创新的人工智能地图搜索工具,可提供快速、精确的位置结果。用户可以用自然语言输入描述性短语或位置相关信息来查询位置。地址:https://www.chatmap-ai.com/站长网2023-08-24 16:51:290000AMD第三季度业绩强势增长353% 第四季度营收展望未达预期
北京时间11月1日消息,美国芯片制造商高级微设备公司(AMD)今天公布了2023财年第三季度财报。报告显示,AMD第三季度净利润同比大增353%,达到2.99亿美元,但给出的第四季度营收展望低于华尔街分析师的预期。0000谷歌2024I/O大会: AI 搜索“AI Overviews”发布
站长之家(ChinaZ.com)5月15日消息:在今日举行的谷歌2024年I/O开发者大会上,谷歌公司正式推出了其全新搜索体验——“AIOverviews”,这标志着谷歌搜索引擎问世25年来的又一次重大更新。据悉,该体验将于本周首先在美国地区上线,随后将逐步推广至全球更多国家和地区。站长网2024-05-15 08:29:510000一公司未经许可向用户提供AI换脸模版 被判侵权并赔偿1000元
据北京市通州区人民法院消息,最近,AI技术越来越受到关注,其中“AI孙燕姿”、“AI王菲”等AI音乐人的出现更是引起了一波热潮。然而,随着AI技术的不断发展,也出现了一些不法分子利用AI技术进行伪造、欺诈等违法行为。北京市通州区人民法院近期发现,一些人利用AI换脸拟声技术进行不法行为,例如伪造不雅视频、进行诈骗等。这些行为不仅侵犯了他人的合法权益,也会对社会造成不良影响。站长网2023-07-21 17:54:490001跳票七年!马斯克官宣新款特斯拉Roadster将于明年生产
快科技7月25日消息,备受瞩目的新款特斯拉Roadster最近有了显著进展。近日,特斯拉CEO埃隆马斯克宣布,这款备受期待的电动跑车预计将于明年正式投产。自2017年特斯拉首次发布新款Roadster原型车并承诺2020年开始生产以来,该车型的上市时间多次推迟,导致一些消费者对其能否真正上市持怀疑态度。站长网2024-07-25 15:29:490000