该文介绍了一种名为DCL的物理视听常识推理的解缚对抗学习方法,旨在根据视频和音频输入推断物体的物理常识,并模拟人类的推理能力。实验结果表明,该方法改进了基线方法并取得了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。