基于大型语言模型的统一面部动作单元识别框架
发表于: 。本研究针对情感计算领域中的面部动作单元(AUs)识别难题,提出了AU-LLaVA,这是首个基于大型语言模型的统一AU识别框架。通过对不同AU数据集的微调,AU-LLaVA在BP4D和DISFA数据集上实现了近一半AUs的最高准确率,提高了特定AU识别的F1-score高达11.4%。
本研究针对情感计算领域中的面部动作单元(AUs)识别难题,提出了AU-LLaVA,这是首个基于大型语言模型的统一AU识别框架。通过对不同AU数据集的微调,AU-LLaVA在BP4D和DISFA数据集上实现了近一半AUs的最高准确率,提高了特定AU识别的F1-score高达11.4%。