小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
语言模型的集体意识

语言模型的“集体意识”现象导致不同模型在开放性问题上给出相似答案。研究表明,模型间输出高度重叠,可能是由于训练数据和奖励模型的重叠。长期使用同质化工具可能限制用户思维多样性,因此在训练阶段需解决多样性问题。

语言模型的集体意识

Finisky Garden
Finisky Garden · 2026-04-17T00:36:42Z
ICLR 2025 杰出论文:一次训练就能计算数据价值——AI 版权和数据治理的新突破

本文提出了In-Run Data Shapley方法,实时追踪训练数据对模型的贡献,解决了传统方法计算复杂度高的问题。研究表明,数据价值在训练过程中会变化,精心策划的数据集可能仍包含负面数据,强调了数据治理的重要性。该方法为AI版权和数据质量提供了新视角,具有广泛的应用前景。

ICLR 2025 杰出论文:一次训练就能计算数据价值——AI 版权和数据治理的新突破

Micropaper
Micropaper · 2026-03-01T05:30:00Z
别再用提示词去 AI 味了,方向就是错的

去除AI写作的“AI味”需要建立个性化的写作风格文档,通过分析满意的文章逐步更新风格偏好,使AI更好地理解和模仿个人风格。每次修改都是训练数据,经过反复迭代,AI输出将更贴近个人特色。

别再用提示词去 AI 味了,方向就是错的

宝玉的分享
宝玉的分享 · 2026-02-14T00:00:00Z
CS231n 讲义 I:图像分类

图像分类任务是将输入图像分配给固定类别标签,面临视角、尺度、变形、遮挡和光照等挑战。有效模型需对这些变化不敏感,同时对类别间变化敏感。通过积累标记图像的训练数据集,开发学习算法进行分类,并通过预测新图像标签评估分类器质量。k近邻分类器通过投票确定标签。

CS231n 讲义 I:图像分类

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-10T00:45:09Z
CS231n 讲义 I:图像分类

图像分类任务是将输入图像分配给固定类别,面临视角、尺度、变形和遮挡等挑战。通过数据驱动的方法,积累标记图像的训练数据集,开发学习算法。使用最近邻分类器评估模型准确性,并通过交叉验证调整超参数。

CS231n 讲义 I:图像分类

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-10T00:45:09Z
参数到底是什么?!

机器学习模型的参数决定其行为和性能,影响预测结果。训练数据质量直接影响参数学习,参数过多或过少可能导致过拟合或欠拟合。理解参数对掌握机器学习至关重要。

参数到底是什么?!

KDnuggets
KDnuggets · 2026-02-02T15:00:39Z
谷歌DeepMind推出ATLAS多语言模型的扩展规律

谷歌DeepMind研究人员推出ATLAS,探讨多语言模型的扩展规律,分析模型规模、训练数据与语言混合的相互作用。基于774次训练,ATLAS明确了跨语言迁移与多语言训练的效率权衡,发现增加语言数量会降低每种语言的性能,但积极的跨语言迁移可部分抵消这一影响。

谷歌DeepMind推出ATLAS多语言模型的扩展规律

InfoQ
InfoQ · 2026-01-29T06:09:00Z
nanobot-mid-train

文章讨论了纳米机器人训练过程中使用的数据,包括数学、选择题和对话等多种模式。这些训练数据旨在提升模型的对话能力和问题回答的准确性。

nanobot-mid-train

plus studio
plus studio · 2026-01-18T00:00:00Z
LLM的弱点——不能很好的讲笑话?

文章探讨了大型语言模型(LLM)在幽默生成方面的不足。作者指出,LLM在处理明确答案的任务时表现良好,但在幽默和多义性上存在局限,无法随机生成笑话,常常重复经典笑话,导致幽默感缺失。此外,AI的幽默理解和生成能力受限于训练数据,难以适应不同文化的笑话风格。

LLM的弱点——不能很好的讲笑话?

Est's Blog
Est's Blog · 2026-01-01T15:57:00Z
在本地GPU上预训练Llama模型

本文介绍了如何在本地GPU上预训练Llama模型,包括训练特定标记的分词器、准备训练数据和执行预训练。使用HuggingFaceFW/fineweb数据集,创建一个12层的Llama模型,并设置训练参数以实现模型训练。

在本地GPU上预训练Llama模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-22T04:27:38Z
Ilya:扩展时代已经结束了,研究的时代已经开始

Ilya Sutskever 在播客中讨论了 AI 的泛化能力不足、训练数据选择问题以及人类学习速度快的原因。他指出,当前 AI 模型在考试中表现良好,但在实际应用中能力有限,强调需要关注模型的泛化能力和学习效率。他认为 AGI 应该是能够快速学习的系统,而不是一开始就具备所有技能的成品。

Ilya:扩展时代已经结束了,研究的时代已经开始

宝玉的分享
宝玉的分享 · 2025-11-26T05:34:20Z
为BERT训练准备数据

本文介绍了为BERT模型准备训练数据的过程,包括创建掩码语言模型(MLM)和下一个句子预测(NSP)数据。首先处理文档生成句子对,然后对句子进行掩码处理,最后将数据保存为parquet格式以便重用。这些步骤有效地为BERT模型提供训练数据。

为BERT训练准备数据

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-24T05:22:00Z

奥特曼宣布ChatGPT更新,解决了用户对AI生成内容中破折号过度使用的问题。研究表明,这种偏好可能源于训练数据中的历史文献。

ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了

量子位
量子位 · 2025-11-16T05:13:31Z
澳鹏数据发布RoboGo具身智能数据开发平台

澳鹏数据推出RoboGo具身智能数据开发平台,旨在解决高质量训练数据稀缺问题。该平台结合多项技术,提供精准目标识别、高精度3D点云、视频内容解析及物理因果链学习,支持智能体在复杂环境中的认知与任务规划。

澳鹏数据发布RoboGo具身智能数据开发平台

全球TMT-美通国际
全球TMT-美通国际 · 2025-10-16T02:57:58Z
语言模型为何会产生幻觉?

语言模型的幻觉源于训练和评估程序奖励猜测而非承认不确定性。即使训练数据完美,模型仍可能出现错误,评估标准的偏差使幻觉持续存在,统计不确定性和任意事实是预训练错误的关键因素。

语言模型为何会产生幻觉?

KDnuggets
KDnuggets · 2025-09-24T16:00:16Z

微软亚洲研究院提出DELT新范式,通过优化训练数据的顺序,提升语言模型性能,无需增加数据量或模型规模。该方法强调数据组织的重要性,结合数据评分、选择和排序,显著提高模型训练效率和泛化能力。

调整训练数据出场顺序大模型就能变聪明!无需扩大模型/数据规模

量子位
量子位 · 2025-09-06T04:02:09Z

最新研究表明,视觉模型与人脑的相似性受模型大小、训练数据量和图像类型的影响。DINOv3模型在训练中逐步与人脑表征一致,尤其在使用人类相关图像时效果最佳。研究发现,模型学习的表征层级与大脑结构高度一致,不同特征的出现速度也存在差异。

最新研究揭示视觉模型与人脑的对齐机制

量子位
量子位 · 2025-09-02T04:57:59Z

本文探讨了RLDG(通过强化学习实现机器人通用策略蒸馏),强调其在生成高质量训练数据方面的优势。RLDG结合强化学习与基础模型的泛化能力,能够在复杂任务中超越人类示范,尤其在精确操作中表现出色。实验结果显示,RLDG策略在新场景中的成功率显著高于传统方法,展现了其在机器人操作中的潜力。

知识蒸馏RLDG:先基于精密任务训练RL策略(HIL-SERL),得到的RL数据去微调VLA,最终效果超越人类演示数据

结构之法 算法之道
结构之法 算法之道 · 2025-08-30T04:09:49Z

本文介绍了如何使用Notion创建健身记录看板,记录锻炼部位、次数和组数,并通过Notion API实现数据查询和自动化总结。用户可通过模板和按钮方便地记录和查看训练数据,提高健身管理效率。

巧用 Notion 搭建运动健身记录看板

少数派
少数派 · 2025-08-12T03:30:59Z
生僻字

文章探讨了大语言模型对生僻字的识别能力,关注训练数据是否涵盖所有汉字,并提及相关的汉字数字化和生僻字处理资源与平台。

生僻字

Tmr Blog
Tmr Blog · 2025-08-07T14:05:42Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码