本研究提出了一种新的任务:在实时3D场景中进行语言指导的物体放置。建立了基准和评估协议,并提供了训练数据集,首次提出了基线方法,以评估通用3D大语言模型的性能。
本研究提出了一个统一的基准和评估协议,以解决深度强化学习中的塑性丧失问题,并推出开源框架“塑形”,提供多种减轻方法和评估指标,推动该领域的研究进展。
本研究提出了一种新评估协议,解决了自我监督学习在3D场景理解中的局限性。通过掩蔽场景建模,所开发的自我监督模型在性能上与有监督模型相当,并超越了现有方法。
本研究探讨了动态场景图生成中的精度-召回权衡、三元组重要性意识不足和评估协议不当等问题。通过分析视频中的大型多模态模型,发现简单解码结构能够有效解决这些问题,并在少量微调下实现最佳效果,展现出重要的研究潜力。
本研究探讨了图学习在药物设计和分子属性预测中的基准挑战,指出现有基准缺乏实际应用的关注,建议采用更具意义的基准和评估协议,以促进研究进展和领域合作。
本研究解决了神经文本到音频生成中的可控性和评估问题,提出了有效的评估协议,发现大模型表现优异,轻量化方法也展现出潜力,为音频质量和合成器架构提供了重要方向。
本研究探讨视觉-语言模型在空间表达中的模糊性,提出评估协议COMFORT,发现模型在鲁棒性和跨文化适应性方面存在不足,呼吁关注这些问题。
本研究通过重新排序的方法解决了跨语言摘要的语义一致性问题,实现了不同语言间的语义相似的多目标摘要,并制定了多标准评估协议。
本研究分析了当前归纳链接预测评估协议的缺陷,指出其过于依赖小规模随机抽样的负实体。研究提出了一种改进的抽样协议,并在多个基准上重新评估现有方法,发现结果与之前报告的差异显著。
本文研究了文本后门攻击对NLP系统的威胁,并提出了评估协议和开源工具包OpenBackdoor。文章探讨了攻击和防御模型的性能,并提出了聚类-based的防御策略CUBE。
本文研究了文本后门攻击对NLP系统的威胁,并提出了评估协议和开源工具包OpenBackdoor。文章讨论了攻击和防御模型的性能,并提出了聚类-based的防御策略CUBE。
本文研究了使用预训练视觉-语言模型进行开放词汇的时序动作定位,并通过自训练和引入伪标签数据集来提高动作定位器的泛化能力。同时提出了新的评估协议来解决现有评估方案的问题。
该研究提出了一种全新的基线异常检测方法,能够在复杂的监控视频中以完全无监督的方式定位异常事件,并在隐私保护的参与者分布式训练配置下进行。同时,还提出了三种新的评估协议,对各种协作和数据可用性场景下的异常检测方法进行基准测试,并在两个大规模数据集上进行了广泛评估。
该文章讨论了视觉语言模型在开放集识别中的问题,提出了修订定义和评估协议以促进标准化评估和研究。同时,还评估了一些基线方法。
本文提出了一种基于条件扩散模型的图像到图像转换框架,超越了所有任务上的强基线,无需任务特定的超参数调整、架构定制或辅助丢失或新技术。作者还提倡了一个基于ImageNet的统一评估协议,以推进图像到图像翻译研究。最后,作者展示了一个通用的,多任务扩散模型的执行效果与任务特定的专家模型相当或更好。
研究表明,基于裁剪和量化的无需训练和无需数据的压缩方法在压缩大型语言模型方面取得了成功。LLM-KICK评估协议揭示了当前最先进的压缩方法的优缺点,并展示了稀疏化和量化对于语言任务的影响。希望这项研究能够促进更好的语言模型压缩方法的发展。
本文总结了网络表征学习技术的文献,分类和分析了评估协议,比较了算法性能和复杂度,并提出未来研究方向。
本文提出了一种基于条件扩散模型的图像到图像转换框架,并在四个具有挑战性的任务中测试。作者提倡一个基于ImageNet的统一评估协议,期望在推进图像翻译研究方面起到作用。最后,作者展示了通用的多任务扩散模型的执行效果与任务特定的专家模型相当或更好。
完成下面两步后,将自动完成登录并继续当前操作。