小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了利用文本条件图像生成构建分类器训练集的挑战,并提出了文本条件知识回收(TCKR)管道。研究表明,使用TCKR生成的数据训练的模型在分类准确性上可与真实图像相媲美,同时显著提高隐私保护特性。

Your Image Generator Is Your New Private Dataset

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z

本研究提出了一种可扩展的RepoST方法,解决了现有方法在完整仓库执行中的复杂性问题。通过沙箱测试提供反馈,构建特定函数的测试环境。关键发现是,RepoST-Train构建的大规模训练集显著提升了代码生成模型的性能,具有重要的实际应用价值。

RepoST:可扩展的仓库级编码环境构建与沙箱测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究探讨如何利用日本PDF数据提升大型多模态模型(LMMs)的性能。通过自动提取PDF中的图文对,构建了丰富的训练集,实验证明在日本LMM基准测试中显著提高了模型性能,展示了PDF数据的多模态资源价值。

Harnessing PDF Data to Enhance the Performance of Japanese Large Multimodal Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z
PyTorch中的ImageNet

本文介绍了如何使用ImageNet数据集,包括ImageNet()函数的参数设置,如数据根目录、数据分割(训练或验证)、变换和加载器。用户需手动下载数据集并运行ImageNet()以提取数据。训练集包含1281167张图像,验证集有50000张,并提供了加载和显示图像的示例代码。

PyTorch中的ImageNet

DEV Community
DEV Community · 2024-12-24T20:57:52Z
PyTorch中的Oxford-IIIT Pet

Oxford-IIIT Pet数据集的使用方法包括设置根路径、数据分割和目标类型等参数。用户可以选择训练集或测试集,并支持类别、二元类别和分割标签。数据集可通过指定参数进行下载和提取,示例代码展示了如何加载和显示数据。

PyTorch中的Oxford-IIIT Pet

DEV Community
DEV Community · 2024-12-14T17:53:48Z

Wake Vision是一个新发布的大规模数据集,专为TinyML中的人检测任务设计,包含约600万张高质量图像。它提供两种训练集,帮助研究人员在数据量和质量之间找到平衡,从而提升模型在真实场景中的表现。

介绍Wake Vision:一个高质量的大规模数据集,用于TinyML计算机视觉应用

The TensorFlow Blog
The TensorFlow Blog · 2024-12-05T17:00:00Z
使用U-Net算法从卫星图像中识别陆地和水体

本文介绍了使用U-Net算法从卫星图像中识别陆地和水体的过程。首先导入TensorFlow、OpenCV和NumPy等库,下载并加载数据集中的图像和掩膜。接着进行图像预处理和归一化,并将数据集划分为训练集和测试集。构建U-Net模型后进行训练,并使用回调函数优化训练过程。最后,通过可视化和IoU评估模型性能。

使用U-Net算法从卫星图像中识别陆地和水体

DEV Community
DEV Community · 2024-12-02T18:21:44Z

本文评估了大型语言模型(LLMs)在生物医学任务中的表现,发现它们在小型训练集上超越了现有模型,显示出潜力。不同LLMs的性能因任务而异,但整体仍不及经过精细调整的模型。

利用大型语言模型支持生物医学数据协调的自然语言处理方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本文介绍了EditVid-QA视频问答基准,涵盖特效、搞笑、网络迷因和游戏四类编辑。研究发现现有的视频LMMs在编辑视频上表现不佳。通过基于Panda-70M/WebVid和TikTok/CapCut视频收集训练集,提升了EditVid-QA的性能。评估中使用GPT-4 judge和关键词过滤来避免“sorry”攻击。数据集仅供学术用途。

Q-Bench-Video:视频质量理解的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本研究提出了一种利用少量例子的成对排名模型,通过增强训练集中相似查询的偏好示例,解决传统监督排名模型在复杂流程中的问题,显著提升检索效果,简化训练流程。

少样本成对排名提示:一种有效的非参数检索模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

研究评估了大型语言模型(LLMs)在生物医学任务中的性能,发现LLMs在具有较小训练集的生物医学数据集中表现出色,甚至超过了当前最先进的生物医学模型。然而,不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比,LLMs的性能仍然较差,但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

Elsevier Arena: 人工评估化学/生物/健康基础大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

研究发现深度学习模型对相机陷阱图像的分析有效,模型架构对生态指标影响较小,噪声和数据集大小则显著影响物种丰富度、栖息率和活动模式。结果强调了深度学习模型在生态分析中的有效性和创建高质量训练集的必要性。

基于深度学习的相机陷阱图像生态分析受训练数据质量和规模的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

研究评估了大型语言模型(LLMs)在生物医学任务中的性能,发现LLMs在具有较小训练集的生物医学数据集中表现出色,甚至超过了当前最先进的生物医学模型。然而,不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比,LLMs的性能仍然较差,但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

面向医疗的大型语言模型评估与构建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

研究评估了大型语言模型(LLMs)在生物医学任务中的性能,发现LLMs在具有较小训练集的生物医学数据集中表现出色,甚至超过了当前最先进的生物医学模型。然而,不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比,LLMs的性能仍然较差,但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

大型语言模型的概率医学预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z

本研究提出了一种新颖的面部表情识别(FER)方法,通过使用训练集提升了FER方法的零样本泛化能力。实验证明该方法在五个不同的FER数据集上优于现有方法。

通用面部表情识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-20T00:00:00Z

研究评估了大型语言模型(LLMs)在生物医学任务中的性能,发现LLMs在具有较小训练集的生物医学数据集中表现出色,甚至超过了当前最先进的生物医学模型。然而,不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比,LLMs的性能仍然较差,但它们在缺乏大规模注释数据的生物医学任务中具有潜在价值。

MedTsLLM:利用大规模语言模型进行多模态医学时间序列分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-14T00:00:00Z

研究评估了大型语言模型(LLM)在生物医学任务中的性能,发现LLMs在具有较小训练集的生物医学数据集中表现出色,甚至超过了当前最先进的生物医学模型。然而,不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比,LLMs的性能仍然较差,但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

PM-LLM-Benchmark: 评估大型语言模型在过程挖掘任务上的表现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

本文研究了深度神经网络中输入损失曲率的特性,探讨了训练集和测试集之间的损失曲率变化及其对测试集辨别性的影响。实验证实了输入损失曲率在成员隶属推断攻击中的效果优于现有方法,基于曲率的攻击在足够大的数据集上胜过其他方法。这些发现不仅推进了对深度神经网络行为的理解,还改进了测试隐私保护技术的能力。

曲率线索:用输入失真曲率解码深度学习隐私

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-03T00:00:00Z

大语言模型的使用引发了版权纠纷。本文提出了一种新的数据集推断方法,成功地识别了大语言模型的训练集和测试集。

LLM 数据推断:你在我的数据集上训练了吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

研究评估了大型语言模型(LLMs)在生物医学任务中的性能,发现LLMs在具有较小训练集的生物医学数据集中表现出色,甚至超过了当前最先进的生物医学模型。然而,不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比,LLMs的性能仍然较差,但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

BMRetriever: 优化大型语言模型作为更好的生物医学文本检索器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码