TeGit: 基于文本支撑任务设计的高质量指导调优数据生成
原文中文,约400字,阅读约需1分钟。发表于: 。通过训练语言模型自动设计任务而收集高质量的教学适应数据的可扩展方法,自动生成任务指导、输入和输出,用于过滤噪音,并通过自动和手工评估实验来证明数据集的质量。
InstructionGPT-4是一种能够遵循指令的模型,通过微调小数据集实现。作者提出了评估多模态指令数据质量的度量标准和数据选择器。采用这种方法,InstructionGPT-4表现优于原始的MiniGPT-4。研究结果表明,高质量的微调数据能够提高多模态大型语言模型的输出质量。