本研究提出了一种新型融合模型OMniBAN,旨在提高医学视觉问答的效率。该模型结合正交损失、多头注意力和双线性注意力网络,实验结果表明其在医学视觉问答基准测试中优于传统模型,并降低了计算成本,具有临床应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。