本研究提出了Graphusion框架,旨在解决知识图谱构建中的局部视角问题。通过零-shot方法从自由文本中构建知识图谱,并设计了融合模块,以提高实体提取和关系识别的准确性,展示了在教育场景中的应用潜力。
本研究提出VLM-Grounder框架,旨在解决传统3D视觉定位在数据稀缺时的局限性。通过动态拼接图像序列和定向反馈,能够精确估计3D边界框。实验结果表明,该方法在ScanRefer和Nr3D数据集上优于以往的零-shot方法,展现出强大的应用潜力。
本研究提出了一种基于预训练扩散模型的零-shot方法,解决4D人机交互生成中的数据不足问题。通过Lang-SAM优化接触部位和线性混合皮肤功能,提高了生成的一致性和鲁棒性,为人本4D内容创作开辟了新方向。
完成下面两步后,将自动完成登录并继续当前操作。