小红花·文摘

本文探讨了利用文本条件图像生成构建分类器训练集的挑战，并提出了文本条件知识回收(TCKR)管道。研究表明，使用TCKR生成的数据训练的模型在分类准确性上可与真实图像相媲美，同时显著提高隐私保护特性。

Your Image Generator Is Your New Private Dataset

BriefGPT - AI 论文速递 ·

本研究提出了一种可扩展的RepoST方法，解决了现有方法在完整仓库执行中的复杂性问题。通过沙箱测试提供反馈，构建特定函数的测试环境。关键发现是，RepoST-Train构建的大规模训练集显著提升了代码生成模型的性能，具有重要的实际应用价值。

RepoST：可扩展的仓库级编码环境构建与沙箱测试

BriefGPT - AI 论文速递 ·

本研究探讨如何利用日本PDF数据提升大型多模态模型（LMMs）的性能。通过自动提取PDF中的图文对，构建了丰富的训练集，实验证明在日本LMM基准测试中显著提高了模型性能，展示了PDF数据的多模态资源价值。

Harnessing PDF Data to Enhance the Performance of Japanese Large Multimodal Models

BriefGPT - AI 论文速递 ·

PyTorch中的ImageNet

DEV Community ·

PyTorch中的Oxford-IIIT Pet

DEV Community ·

Wake Vision是一个新发布的大规模数据集，专为TinyML中的人检测任务设计，包含约600万张高质量图像。它提供两种训练集，帮助研究人员在数据量和质量之间找到平衡，从而提升模型在真实场景中的表现。

介绍Wake Vision：一个高质量的大规模数据集，用于TinyML计算机视觉应用

The TensorFlow Blog ·

使用U-Net算法从卫星图像中识别陆地和水体

DEV Community ·

本文评估了大型语言模型（LLMs）在生物医学任务中的表现，发现它们在小型训练集上超越了现有模型，显示出潜力。不同LLMs的性能因任务而异，但整体仍不及经过精细调整的模型。

利用大型语言模型支持生物医学数据协调的自然语言处理方法

BriefGPT - AI 论文速递 ·

本文介绍了EditVid-QA视频问答基准，涵盖特效、搞笑、网络迷因和游戏四类编辑。研究发现现有的视频LMMs在编辑视频上表现不佳。通过基于Panda-70M/WebVid和TikTok/CapCut视频收集训练集，提升了EditVid-QA的性能。评估中使用GPT-4 judge和关键词过滤来避免“sorry”攻击。数据集仅供学术用途。

Q-Bench-Video：视频质量理解的基准测试

BriefGPT - AI 论文速递 ·

本研究提出了一种利用少量例子的成对排名模型，通过增强训练集中相似查询的偏好示例，解决传统监督排名模型在复杂流程中的问题，显著提升检索效果，简化训练流程。

少样本成对排名提示：一种有效的非参数检索模型

BriefGPT - AI 论文速递 ·

研究评估了大型语言模型（LLMs）在生物医学任务中的性能，发现LLMs在具有较小训练集的生物医学数据集中表现出色，甚至超过了当前最先进的生物医学模型。然而，不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比，LLMs的性能仍然较差，但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

Elsevier Arena: 人工评估化学/生物/健康基础大型语言模型

BriefGPT - AI 论文速递 ·

研究发现深度学习模型对相机陷阱图像的分析有效，模型架构对生态指标影响较小，噪声和数据集大小则显著影响物种丰富度、栖息率和活动模式。结果强调了深度学习模型在生态分析中的有效性和创建高质量训练集的必要性。

基于深度学习的相机陷阱图像生态分析受训练数据质量和规模的影响

BriefGPT - AI 论文速递 ·

面向医疗的大型语言模型评估与构建

BriefGPT - AI 论文速递 ·

大型语言模型的概率医学预测

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的面部表情识别（FER）方法，通过使用训练集提升了FER方法的零样本泛化能力。实验证明该方法在五个不同的FER数据集上优于现有方法。

通用面部表情识别

BriefGPT - AI 论文速递 ·

研究评估了大型语言模型（LLMs）在生物医学任务中的性能，发现LLMs在具有较小训练集的生物医学数据集中表现出色，甚至超过了当前最先进的生物医学模型。然而，不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比，LLMs的性能仍然较差，但它们在缺乏大规模注释数据的生物医学任务中具有潜在价值。

MedTsLLM：利用大规模语言模型进行多模态医学时间序列分析

BriefGPT - AI 论文速递 ·

研究评估了大型语言模型（LLM）在生物医学任务中的性能，发现LLMs在具有较小训练集的生物医学数据集中表现出色，甚至超过了当前最先进的生物医学模型。然而，不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比，LLMs的性能仍然较差，但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

PM-LLM-Benchmark: 评估大型语言模型在过程挖掘任务上的表现

BriefGPT - AI 论文速递 ·

本文研究了深度神经网络中输入损失曲率的特性，探讨了训练集和测试集之间的损失曲率变化及其对测试集辨别性的影响。实验证实了输入损失曲率在成员隶属推断攻击中的效果优于现有方法，基于曲率的攻击在足够大的数据集上胜过其他方法。这些发现不仅推进了对深度神经网络行为的理解，还改进了测试隐私保护技术的能力。

曲率线索：用输入失真曲率解码深度学习隐私

BriefGPT - AI 论文速递 ·

大语言模型的使用引发了版权纠纷。本文提出了一种新的数据集推断方法，成功地识别了大语言模型的训练集和测试集。

LLM 数据推断：你在我的数据集上训练了吗？

BriefGPT - AI 论文速递 ·

BMRetriever: 优化大型语言模型作为更好的生物医学文本检索器

BriefGPT - AI 论文速递 ·