本研究提出了一种基于文本监督的混合技术,以改善深度神经网络在处理长尾类别数据时的表现。该方法通过利用预训练文本编码器识别类之间的语义关系,显著提高了模型在少样本类上的分类性能。
本研究提出了一种基于事件引导的范式,用于从带有文本监督的指令视频中进行过程规划的任务。该模型采用遮盖和预测方法进行关系挖掘,并将事件信息编码到顺序建模过程中来支持过程规划。实验证明了该模型的有效性。
完成下面两步后,将自动完成登录并继续当前操作。