夸克AI超级框推出“拍照问夸克”功能,增强多模态能力,支持视觉搜索和多轮问答。用户可通过AI相机识别图片细节,完成数据分析和健康建议等复杂任务,提升用户体验。
本文介绍了SciGraphQA数据集,它是一个合成的多轮问答数据集,使用295K个开放式多轮问答对话样本,并通过GPT-4评估了问题-回答的匹配质量。通过利用从图表中提取的序列化数据表格和DePlot模型,使用LLaVA-13B进行了进一步的改进,最终的评估CIDEr为0.26。
完成下面两步后,将自动完成登录并继续当前操作。