小红花·文摘

问答：今天的代理人工智能是什么，我们希望它成为什么？

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) ·

人形机器人即将到来。真的会吗？

The Verge ·

本研究提出了一种基于上下文表示学习的运动预训练方法，有效解决了单目3D人姿态估计中的深度模糊和数据不足问题，显著提升了模型的时空关系理解能力，并在两个基准数据集上取得了优异性能。

基于上下文表示学习的双流Transformer-GCN模型用于单目3D人姿态估计

BriefGPT - AI 论文速递 ·

本研究提出FlowDistill框架，旨在解决城市交通流预测中的时空依赖性和数据不足问题。该框架通过知识蒸馏实现轻量化，显著提高了预测的准确性和效率。

FlowDistill：通过大语言模型的蒸馏实现可扩展的交通流预测

BriefGPT - AI 论文速递 ·

本文提出了一种新混合方法FIG，旨在解决领域特定事件检测中的数据不足问题。FIG结合正向与反向生成技术，显著提高了事件检测的准确性，F1得分在零样本和少样本设置下分别提升3.3%和5.4%。

FIG: Bidirectional Generation for Low-Resource Domain-Specific Event Detection

BriefGPT - AI 论文速递 ·

本文提出了一种新方法，通过逐步任务增强和关系学习解决方面情感四元预测中的数据不足问题，显著提升了预测性能，实验结果在多个基准数据集上表现优异。

STAR: Stepwise Task Augmentation and Relation Learning for Aspect-based Sentiment Quadruple Prediction

BriefGPT - AI 论文速递 ·

本研究提出IIMedGPT模型，旨在解决大型语言模型在医学任务中的数据不足和指令对齐问题。通过引入CMedINS数据集和直接偏好优化方法，IIMedGPT在医学对话任务中表现优于现有模型，显著提升了实用性和精准性。

IIMedGPT: Enhancing Language Model Capabilities for Medical Tasks through Efficient Human Preference Alignment

BriefGPT - AI 论文速递 ·

本研究提出OpenRFT方法，通过强化微调解决特定领域任务中基础模型的数据不足问题。结果表明，使用100个样本显著提升性能。

OpenRFT: Adapting Reasoning Foundation Models for Specific Domain Tasks through Enhanced Fine-Tuning

BriefGPT - AI 论文速递 ·

本研究提出了AgentTrek方法，通过自动收集网络教程，合成高质量的多步骤代理轨迹，有效解决了训练图形用户界面代理时的数据不足问题。该方法显著提升了代理性能，并且比传统人工标注更具成本效益。

AgentTrek: Guiding Replay for Synthesizing Agent Trajectories via Web Tutorials

BriefGPT - AI 论文速递 ·

本文回顾了低资源语言在自然语言处理中的研究进展，分析了数据不足和质量问题的影响，探讨了语言适配器的有效性，并提出改进建议。研究强调了对低资源语言的理解和资源开发的重要性，以推动该领域的发展。

低资源语言的芝诺悖论

BriefGPT - AI 论文速递 ·

本研究结合元启发式算法、传统分类器和神经网络，解决机器学习中的数据不足问题。实验表明，仅依赖标记数据集的验证准确率无法纠正未见数据的标签，这对未来数据挖掘技术有重要影响。

Automated Data Mining Approaching the Combination of Metaheuristic and Deep Learning

BriefGPT - AI 论文速递 ·

该研究利用深度学习模型，通过A320航班的快速获取记录数据，识别单引擎滑行模式，解决了数据不足的问题，为未来环境影响评估提供基础。

Detection of Aircraft Single Engine Taxi using Deep Learning Models

BriefGPT - AI 论文速递 ·

本研究提出了一种基于预训练扩散模型的零-shot方法，解决4D人机交互生成中的数据不足问题。通过Lang-SAM优化接触部位和线性混合皮肤功能，提高了生成的一致性和鲁棒性，为人本4D内容创作开辟了新方向。

AvatarGO: Zero-shot 4D Human-Computer Interaction Generation and Animation

BriefGPT - AI 论文速递 ·

本文探讨了语言建模在自动语音识别中的挑战，并提出了针对数据不足、性能测试和生成模型缺陷的解决方案。研究表明，结合大量单语数据和少量代码切换数据进行微调训练更为有效。此外，介绍了新型语音翻译模型LLM-ST及其在语音翻译领域的优越表现，并总结了多语言大型语言模型的技术特点及局限性。

利用构建的代码切换数据增强大语言模型的多语言语音生成和识别能力

BriefGPT - AI 论文速递 ·

本研究提出了多尺度和聚焦上下文的提示调优（MSCPT）方法，解决了少样本弱监督全切片图像分类中的数据不足和稀有疾病的问题。实验证明，MSCPT在多个数据集上表现出强大的效果。

MSCPT: Few-Shot Whole-Slide Image Classification Based on Multi-Scale and Focused Context Prompt Tuning

BriefGPT - AI 论文速递 ·

本文探讨了语言建模在自动语音识别中的挑战，并提出了针对数据不足、性能测试和生成模型缺陷的解决方案。研究表明，使用独立评估数据集和判别式训练方法更为有效。此外，改进的上下文偏置注意力模型显著提高了罕见词汇的识别准确率。

XCB：一种有效的上下文偏倚方法，用于语音识别中的跨语言短语偏倚

BriefGPT - AI 论文速递 ·

本文分析了基于阈值的自动标注系统，探讨了人工标注验证数据量对机器标注数据质量的影响。研究发现，潜在易受攻击函数能显著提高漏洞预测模型性能，并提出了一种新方法解决软件漏洞检测中的数据不足问题，实验结果显示其性能优于现有方法。

软件漏洞预测模型的自动数据标注：我们到了什么程度？

BriefGPT - AI 论文速递 ·

本文综述了少样本物体检测的研究进展，探讨了数据不足对深度学习的影响，提出了基于数据的训练分类法，分析了主要挑战、基准数据集和评估指标，并展望了未来在医学图像处理中的应用方向。

医疗领域零样本和少样本人工智能算法综述

BriefGPT - AI 论文速递 ·

本研究提出了一种自监督对比学习方法，用于从未标注的面部视频中学习面部动作单元的表示，解决数据不足的问题，并在动作单元检测中取得了较好的区分度。

人脸动作单元检测的个体无关对比学习

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的自我监督预训练方法，解决重症监护中的数据不足问题，并在数据有限的情况下，在院内死亡预测和表型预测等任务中优于基线模型，提升数据分析能力。

基于离线强化学习的重症监护室患者测量调度

BriefGPT - AI 论文速递 ·