本研究探讨大型语言模型(LLMs)在重述和翻译任务中检测内在幻觉的能力。分析显示,不同模型在任务表现上存在差异,但在特定提示下表现一致,自然语言推理模型表现优异,表明LLM检测方法并非唯一选择。
本研究提出了ParaAlign Translator方法,以解决大型语言模型在机器翻译中输出质量不稳定的问题。实验结果表明,该方法显著提升了LLaMA-3-8B模型的翻译性能。
本研究探讨了合成数据对大型语言模型(LLMs)训练的影响,发现主观性降低了模型性能,限制了合成数据的潜力。研究强调合成数据多样性对预训练和微调效果的重要性,并提出优化合成数据使用的必要性。
本文探讨了大型语言模型(LLMs)在推理和任务执行中的新方法,包括ReAct、PreAct和Refiner等。研究表明,结合预测与推理能够提升模型在复杂任务中的表现,Refiner通过信息提取与重构显著提高了回答的准确性。这些方法展示了LLMs在多轮交互和复杂查询中的潜力与局限性。
本文介绍了一种通过远程监督微调预训练模型的数据生成技术,旨在实现用户可控的改写生成器。该技术鼓励模型输出多样性,解决短语改写问题,具有语言普适性,并在英文和中文上进行了实验。研究探讨了上下文学习在生成质量和降低有毒性方面的优势,并提出了基于改写生成的方法以提高对话代理的性能和效率。
本研究提出了一种基于预训练语言模型的对称连续提示增强方法(SPE),旨在提高模型在事实性任务上的探测精度。通过建立通信理论框架,评述现有提示工程方法,并提出知识提示范式和KP-PLM框架,以优化大型语言模型的性能。此外,研究探讨了软提示和Hint-before-Solving Prompting方法在提高推理任务准确性方面的应用。
通过引入一个简单的微调方法,我们提出了一种改进 CLIP 模型对于释义的表征的方法,该方法使用大规模语言模型从 Web 规模的图像字幕中自动创建两类释义,并在固定图像编码器的同时微调 CLIP 文本编码器。我们的模型 ParaCLIP 在各种任务中都显示出与基准 CLIP 模型相比的显著改进,包括释义检索、Visual Genome 关系和属性,以及七个语义文本相似度任务。
本文介绍了一种基于语言约束的相似性搜索方法,用于自动产生大规模对齐语料库,以解决基于神经网络的释义生成面临的数据缺乏问题。该方法在意大利语的情况下进行评估,并使用基于指针的深度神经网络架构实验。
完成下面两步后,将自动完成登录并继续当前操作。