TabGen-ICL:残差意识的上下文示例选择用于表格数据生成
📝
内容提要
本研究解决了当前基于大语言模型(LLMs)的表格数据生成方法的局限性,特别是随机示例选择导致的生成质量下降。提出了一种创新的上下文学习框架TabGen-ICL,通过迭代方式从真实样本中检索代表残差的子集,显著提高了生成质量,并在五个真实世界表格数据集上表现出优越性,误差率减少了3.5%-42.2%。
➡️
本研究解决了当前基于大语言模型(LLMs)的表格数据生成方法的局限性,特别是随机示例选择导致的生成质量下降。提出了一种创新的上下文学习框架TabGen-ICL,通过迭代方式从真实样本中检索代表残差的子集,显著提高了生成质量,并在五个真实世界表格数据集上表现出优越性,误差率减少了3.5%-42.2%。