BriefGPT - AI 论文速递 ·

C2C：零次合成行动识别的组件到合成学习

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文探讨了基于因果思想的复合泛化方法，提出了多种机器学习模型，以提升零样本推理和动作识别的效果。研究涵盖因果启发的嵌入模型、组合行为识别任务、无监督动作识别方法及组合图嵌入技术，均在多个数据集上表现优异，展示了在复杂情况下的有效性和广泛应用前景。

🎯

关键要点

利用因果思想构建复合泛化的方法，将零样本推理视为查找干预与图像之间的关系。
提出因果启发的嵌入模型，从混淆训练数据中学习可视对象的基本部分的分解表示，提升属性预测的效果。
新颖的机器学习模型通过动态学习主体-对象交互，探究行为的组成性，验证了在Something-Something数据集上的有效性。
基于物体和场景组成误差的无监督零样本动作识别方法，不依赖已训练的视频集，显著提高动作识别效果。
Composition Transformer（CoT）框架解决组合式零样本学习中的上下文问题和数据分布问题，提升视觉辨识能力。
基于模块化体系结构的深度神经网络在零样本情况下进行组合推理和分类，优于现有方法。
提出条件属性嵌入的学习框架，解决组合零样本学习中的属性建模问题，取得较优表现。
Compositional Graph Embedding（CGE）方法实现组合视觉对象的识别，避免外部知识库的依赖，性能优于其他方法。
Siamese对比嵌入网络（SCEN）和状态转移模块（STM）在复杂无监督学习任务中表现优异。
基于结构化关注融合自注意机制的框架有效识别由简单组件组成的动作标签，具有良好的泛化性能。
组合动作识别方法通过时空交互编码器捕捉人体-物体交互，获得先进性能，表明建模交互行为的有效性。

❓

延伸问答

什么是零样本推理？

零样本推理是指在没有训练样本的情况下，通过查找干预与图像之间的关系来进行推理。

因果启发的嵌入模型有什么优势？

因果启发的嵌入模型能够从混淆训练数据中学习可视对象的基本部分的分解表示，从而提升属性预测的效果。

Composition Transformer（CoT）框架的作用是什么？

CoT框架解决组合式零样本学习中的上下文问题和数据分布问题，提升视觉辨识能力。

无监督零样本动作识别方法的特点是什么？

该方法不依赖已训练的视频集，基于物体和场景组成误差显著提高动作识别效果。

Compositional Graph Embedding（CGE）方法的优势是什么？

CGE方法能够实现组合视觉对象的识别，避免外部知识库的依赖，性能优于其他方法。

Siamese对比嵌入网络（SCEN）在学习任务中表现如何？

SCEN在复杂无监督学习任务中表现优异，实验结果显示其在多个基准数据集上大幅优于现有方法。

🏷️

标签

动作识别因果思想复合泛化机器学习模型组件零样本推理

➡️

继续阅读

AWS Billing Bug Shows Customers Trillion-Dollar Estimates While Its Own Cost Alarms Fail to Act
A configuration change in AWS's bill computation system showed customers ...
【公共云三十问之九】先进公共云的发展蓝图包括哪些方面？
等能力，高效聚合数据、算力、算法等智能要素，可靠转化为可调用、可扩展、可复用的智能服务，并广泛、便捷地触达产业、民生、科技和全球发展等关键应用场景，充分发...
【公共云三十问之八】公共云如何打开全球发展的新空间？
预计未来十年，AI有望贡献全球GDP增长的7%—15%，智能经济将成为全球经济增长的重要引擎。而对许多发展中经济体而言，智能化基础设施建设面临资金、芯片、...
实测 Doubao-Seed-Evolving：把 Windows 桌面图标做成一个会自己运转的小世界 - 努力的小雨
豆包 Seed 又更新了：一张永远“最新”的模型卡这次豆包推出的不是一个过段时间就会落后的固定版本，而是 Doubao-Seed-Evolving：一个...
【公共云三十问之七】公共云如何助力科技创新？
无锡人工智能创新中心依托国产化弹性算力与全栈服务能力，以公共云CloudRobo具身智能平台为载体，搭建针对性面向工业场景的具身智能解决方案，打造AI+智...
智谱开源模型立大功！摆平一起美国AI内乱事件
【TechWeb】7月22日消息，一场本该在沙盒中进行的内部安全测试，演变为全球首例由AI模型自主实施的真实网络攻击。OpenAI在一篇官方博客文章中承认...