该研究提出了AnomalyGFM模型,解决了通用图模型在图异常检测中的泛化问题,支持零样本推理和少样本调整,显著提升了检测性能。
该研究探讨了大型语言模型在零样本推理中的应用,提出了零样本CoT和Active-Prompt等新方法,显著提升了推理性能。通过改进提示策略和引入跨语言提示,研究展示了模型在复杂推理任务中的优越性,尤其在GPT-4上表现突出。
本文研究了预训练语言模型在零样本事实推理任务中的知识捕获,提出了一种弱监督预训练目标,实验结果显示该模型在答题和实体标注任务上优于BERT。同时,探讨了持续学习算法对模型适应性和知识保留的影响,提出了有效的长文本模型构建方法,并介绍了基于条件文本生成的GeniusAug数据增强方法,显著提升了模型性能。
本文探讨了基于因果思想的复合泛化方法,提出了多种机器学习模型,以提升零样本推理和动作识别的效果。研究涵盖因果启发的嵌入模型、组合行为识别任务、无监督动作识别方法及组合图嵌入技术,均在多个数据集上表现优异,展示了在复杂情况下的有效性和广泛应用前景。
本文提出了一种可解释的3D视觉定位框架,通过锚点预测将3D视觉定位转化为序列任务,提升了性能和数据效率。同时,介绍了3DMV-VQA基准和3D-CLR框架,评估了现有模型的不足,并提出了基于零样本推理的3D分割新任务,有效定位3D对象部分。该方法在机器人、AR/VR等领域具有广泛应用潜力。
本文介绍了多种基于CLIP模型的创新方法,如ComCLIP、S-CLIP和SDS-CLIP,旨在提升图像与文本的匹配能力。这些方法在图像检索和标注任务中表现优异,尤其在零样本推理和医学图像处理方面,显著超越了现有技术。
本文介绍了表格基础模型(TabFMs),通过对大型语言模型(LLM)在表格数据集上的微调,展现出对表格数据的深刻理解和优越性能。研究表明,TabFMs在零样本和上下文推理任务中表现优异,超越了GPT-4等闭源模型。文章还探讨了TabFMs的局限性及未来研究方向,以推动该领域的发展。
本文介绍了一种组合问题图的形式主义,旨在解决机器学习中的推广问题。提出了组合泛化问题和组合递归学习器,强调在多模式环境中利用句法结构的注意力技术提升组合概括的重要性。研究表明,Transformer语言模型在学习离散算法方面的能力有限,且在样本规模上表现不佳。此外,探讨了基于模块化架构的深度神经网络在零样本情况下的组合推理能力,以及生物神经网络对灵活认知的贡献。
本文介绍了一种名为增强检索增强机器学习(RRAML)的框架,结合大型语言模型与用户数据库,解决文本输入的上下文限制。通过增强适应性的文本检索器(AAR)和检索器学习技术(ARL2),显著提高了零样本推理的泛化能力和数据质量。此外,提出的多模态模型和图像修复框架在相关任务中表现优异,降低了训练成本,推动了多模态大型语言模型的应用探索。
该研究探讨了预训练大型语言模型在零样本推理中的应用,提出了零样本链式思考、角色扮演提示和元认知提示等方法,显著提升了模型在复杂推理任务中的性能。通过微调和生成推理样本,优化了小型模型的推理能力,结果显示这些新方法在多项任务中优于传统提示。
传统迁移学习在有限数据和分布转变下效果有限。最近的CLIP模型在零样本推理和鲁棒性方面表现出色。提出了适用于CLIP的小样本微调方法,并在具有分布转变的基准数据集上评估。实验证明,少样本CLIP微调在准确性方面优于只有视觉的模型,为小样本学习应用提供了动力。
完成下面两步后,将自动完成登录并继续当前操作。