小红花·文摘

该研究提出了多种机器人操作学习方法，如ROSIE数据扩充、RoboAgent多任务智能体和ManiCM实时操作模型，旨在提升机器人在新场景中的性能和鲁棒性。通过引入一致性约束和多模态数据，研究在双手灵巧操控和任务完成率方面取得了显著进展。

RDT-1B：用于双手操作的扩散基础模型

BriefGPT - AI 论文速递 ·

本研究评估了204个ImageNet模型在213种测试条件下的表现，发现大多数模型对真实数据分布变化缺乏鲁棒性。训练于更大多样化数据集的模型在多种情况下表现更佳。研究提出了分析分布转移的框架，评估了不同方法的效果，发现预训练和数据扩充在许多情况下优于标准基线。同时，研究强调了在自然分布偏移下评估模型鲁棒性的重要性，并鼓励未来进行更广泛的评估。

控制+转移：生成可控的分布转移

BriefGPT - AI 论文速递 ·

本研究提出了一种框架，用于分析数据分布转移，评估19种方法的有效性。结果表明，预训练和数据扩充在许多情况下优于标准基线，填补了分布式边缘机器学习中监测数据漂移的空白，提供了有效监测用户行为变化的开源框架。

利用鞅进行诊断运行时监测

BriefGPT - AI 论文速递 ·

本文探讨了深度神经网络在检测分布外样本（OOD）时的挑战，提出了一种基于样本熵和温度选择的自适应方法（AIOL），并通过数据扩充提升性能。研究表明，不同的OOD检测技术在评估标准下表现不同，基于置信度的技术在接近OOD样本时效果更佳。实验结果显示，该方法在多个基准数据集上优于现有技术。

重新思考非分布式数据驱动下的分布式检测

BriefGPT - AI 论文速递 ·

本研究探讨了无监督自我学习技术在医学图像中的应用，特别是在乳腺癌检测方面。实验结果表明，强数据扩充方法显著提高了数据利用率，并有效迁移到其他数据集，标志着医学图像人工智能在无监督学习领域的重要突破。

增强的自监督学习用于多模态 MRI 分割和分类：一种避免模型崩溃的新方法

BriefGPT - AI 论文速递 ·

本文介绍了多种针对大型语言模型（LLMs）的指令调优方法，如CodecLM、Semi-Instruct和对比指令调优。这些方法通过改进指令生成和数据集质量，显著提升了模型在代码理解和生成任务中的表现，尤其在处理未知指令时的稳健性。研究表明，适当的微调和数据扩充策略能够有效提高模型的性能和通用性。

InverseCoder: 发挥逆向指令调谐代码语言模型的能力与逆向指令实现

BriefGPT - AI 论文速递 ·

本文探讨了多模态视觉-语言模型（VLM）的能力，提出了用于形式验证的逻辑规范语言Con_spec，并通过实验验证了模型在概念理解方面的不足。研究发现交叉注意力可以提升理解能力，并提出了新的微调技术。此外，介绍了数据扩充方法和幻觉检测模型，以改善VLM在特定领域的表现和常识推理能力。

BACON：利用概念图强化虚拟生命模型以减少幻觉

BriefGPT - AI 论文速递 ·

AWS Lambda 函数现在将处理大量请求时的扩展速度提高 12 倍

亚马逊AWS官方博客 ·

本文提出了多种新方法和数据集，以提高多模态机器翻译的质量，解决数据不足的问题。研究表明，基于数据扩充的语音翻译方法M^3ST在MuST-C基准上表现优异，BLEU得分达到29.9。此外，Tri-Modal Translation模型在语音、图像和文本之间的翻译中表现出色，显示出统一任务的实用性和性能优势。

M3T: 多模文档级机器翻译的新基准数据集

BriefGPT - AI 论文速递 ·

本文探讨了零样本学习在文本分类中的应用，提出了数据扩充、特征扩充和生成对抗网络（GANs）等多种方法。这些方法在不同数据集上表现优于现有技术，提升了模型的泛化能力和分类性能。

解放已见类别：通过锚点生成和分类重构提升少样本和零样本文本分类

BriefGPT - AI 论文速递 ·

本文探讨了对抗样本在语音识别系统中的应用，提出了一种新方法以增强深度神经网络的鲁棒性。研究表明，动态生成对抗样本显著提高了识别准确率，并在多个数据集上验证了其有效性。此外，提出的认证方法和数据扩充方案在处理低频干扰时也表现出优势。

证明说话人识别模型对加性扰动的认证

BriefGPT - AI 论文速递 ·

抖音CV技术团队在ICDAR 2023的“Detecting Tampered Text in Images”比赛中获得第一名。团队使用自研的“CAS”算法，设计了“Classification After Segmentation”的二阶段分类器，并采用多种数据扩充的方式扩充训练样本。最终，团队采用加权平均的方式进行结果融合，并通过对比同源图片的差异获取可靠的局部篡改信息。

自研算法提升文本图像篡改检测精度，抖音技术团队获 ICDAR2023 分类赛道冠军...

字节跳动技术团队官方博客 ·