ViECap是一种可转移的解码模型,利用实体感知解码生成见过和没见过的场景中的描述。通过实体感知的硬提示,ViECap能够在跨多样场景的连贯字幕生成中保持性能,并在跨域字幕生成方面达到最新水平。
完成下面两步后,将自动完成登录并继续当前操作。