小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
语言模型的集体意识

语言模型的“集体意识”现象导致不同模型在开放性问题上给出相似答案。研究表明,模型间输出高度重叠,可能是由于训练数据和奖励模型的重叠。长期使用同质化工具可能限制用户思维多样性,因此在训练阶段需解决多样性问题。

语言模型的集体意识

Finisky Garden
Finisky Garden · 2026-04-17T00:36:42Z
ICLR 2025 杰出论文:一次训练就能计算数据价值——AI 版权和数据治理的新突破

本文提出了In-Run Data Shapley方法,实时追踪训练数据对模型的贡献,解决了传统方法计算复杂度高的问题。研究表明,数据价值在训练过程中会变化,精心策划的数据集可能仍包含负面数据,强调了数据治理的重要性。该方法为AI版权和数据质量提供了新视角,具有广泛的应用前景。

ICLR 2025 杰出论文:一次训练就能计算数据价值——AI 版权和数据治理的新突破

Micropaper
Micropaper · 2026-03-01T05:30:00Z
别再用提示词去 AI 味了,方向就是错的

去除AI写作的“AI味”需要建立个性化的写作风格文档,通过分析满意的文章逐步更新风格偏好,使AI更好地理解和模仿个人风格。每次修改都是训练数据,经过反复迭代,AI输出将更贴近个人特色。

别再用提示词去 AI 味了,方向就是错的

宝玉的分享
宝玉的分享 · 2026-02-14T00:00:00Z
CS231n 讲义 I:图像分类

图像分类任务是将输入图像分配给固定类别标签,面临视角、尺度、变形、遮挡和光照等挑战。有效模型需对这些变化不敏感,同时对类别间变化敏感。通过积累标记图像的训练数据集,开发学习算法进行分类,并通过预测新图像标签评估分类器质量。k近邻分类器通过投票确定标签。

CS231n 讲义 I:图像分类

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-10T00:45:09Z
CS231n 讲义 I:图像分类

图像分类任务是将输入图像分配给固定类别,面临视角、尺度、变形和遮挡等挑战。通过数据驱动的方法,积累标记图像的训练数据集,开发学习算法。使用最近邻分类器评估模型准确性,并通过交叉验证调整超参数。

CS231n 讲义 I:图像分类

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-10T00:45:09Z
参数到底是什么?!

机器学习模型的参数决定其行为和性能,影响预测结果。训练数据质量直接影响参数学习,参数过多或过少可能导致过拟合或欠拟合。理解参数对掌握机器学习至关重要。

参数到底是什么?!

KDnuggets
KDnuggets · 2026-02-02T15:00:39Z
谷歌DeepMind推出ATLAS多语言模型的扩展规律

谷歌DeepMind研究人员推出ATLAS,探讨多语言模型的扩展规律,分析模型规模、训练数据与语言混合的相互作用。基于774次训练,ATLAS明确了跨语言迁移与多语言训练的效率权衡,发现增加语言数量会降低每种语言的性能,但积极的跨语言迁移可部分抵消这一影响。

谷歌DeepMind推出ATLAS多语言模型的扩展规律

InfoQ
InfoQ · 2026-01-29T06:09:00Z
nanobot-mid-train

文章讨论了纳米机器人训练过程中使用的数据,包括数学、选择题和对话等多种模式。这些训练数据旨在提升模型的对话能力和问题回答的准确性。

nanobot-mid-train

plus studio
plus studio · 2026-01-18T00:00:00Z
LLM的弱点——不能很好的讲笑话?

文章探讨了大型语言模型(LLM)在幽默生成方面的不足。作者指出,LLM在处理明确答案的任务时表现良好,但在幽默和多义性上存在局限,无法随机生成笑话,常常重复经典笑话,导致幽默感缺失。此外,AI的幽默理解和生成能力受限于训练数据,难以适应不同文化的笑话风格。

LLM的弱点——不能很好的讲笑话?

Est's Blog
Est's Blog · 2026-01-01T15:57:00Z
在本地GPU上预训练Llama模型

本文介绍了如何在本地GPU上预训练Llama模型,包括训练特定标记的分词器、准备训练数据和执行预训练。使用HuggingFaceFW/fineweb数据集,创建一个12层的Llama模型,并设置训练参数以实现模型训练。

在本地GPU上预训练Llama模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-22T04:27:38Z
Ilya:扩展时代已经结束了,研究的时代已经开始

Ilya Sutskever 在播客中讨论了 AI 的泛化能力不足、训练数据选择问题以及人类学习速度快的原因。他指出,当前 AI 模型在考试中表现良好,但在实际应用中能力有限,强调需要关注模型的泛化能力和学习效率。他认为 AGI 应该是能够快速学习的系统,而不是一开始就具备所有技能的成品。

Ilya:扩展时代已经结束了,研究的时代已经开始

宝玉的分享
宝玉的分享 · 2025-11-26T05:34:20Z
为BERT训练准备数据

本文介绍了为BERT模型准备训练数据的过程,包括创建掩码语言模型(MLM)和下一个句子预测(NSP)数据。首先处理文档生成句子对,然后对句子进行掩码处理,最后将数据保存为parquet格式以便重用。这些步骤有效地为BERT模型提供训练数据。

为BERT训练准备数据

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-24T05:22:00Z

奥特曼宣布ChatGPT更新,解决了用户对AI生成内容中破折号过度使用的问题。研究表明,这种偏好可能源于训练数据中的历史文献。

ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了

量子位
量子位 · 2025-11-16T05:13:31Z
澳鹏数据发布RoboGo具身智能数据开发平台

澳鹏数据推出RoboGo具身智能数据开发平台,旨在解决高质量训练数据稀缺问题。该平台结合多项技术,提供精准目标识别、高精度3D点云、视频内容解析及物理因果链学习,支持智能体在复杂环境中的认知与任务规划。

澳鹏数据发布RoboGo具身智能数据开发平台

全球TMT-美通国际
全球TMT-美通国际 · 2025-10-16T02:57:58Z
语言模型为何会产生幻觉?

语言模型的幻觉源于训练和评估程序奖励猜测而非承认不确定性。即使训练数据完美,模型仍可能出现错误,评估标准的偏差使幻觉持续存在,统计不确定性和任意事实是预训练错误的关键因素。

语言模型为何会产生幻觉?

KDnuggets
KDnuggets · 2025-09-24T16:00:16Z

微软亚洲研究院提出DELT新范式,通过优化训练数据的顺序,提升语言模型性能,无需增加数据量或模型规模。该方法强调数据组织的重要性,结合数据评分、选择和排序,显著提高模型训练效率和泛化能力。

调整训练数据出场顺序大模型就能变聪明!无需扩大模型/数据规模

量子位
量子位 · 2025-09-06T04:02:09Z

最新研究表明,视觉模型与人脑的相似性受模型大小、训练数据量和图像类型的影响。DINOv3模型在训练中逐步与人脑表征一致,尤其在使用人类相关图像时效果最佳。研究发现,模型学习的表征层级与大脑结构高度一致,不同特征的出现速度也存在差异。

最新研究揭示视觉模型与人脑的对齐机制

量子位
量子位 · 2025-09-02T04:57:59Z

本文探讨了RLDG(通过强化学习实现机器人通用策略蒸馏),强调其在生成高质量训练数据方面的优势。RLDG结合强化学习与基础模型的泛化能力,能够在复杂任务中超越人类示范,尤其在精确操作中表现出色。实验结果显示,RLDG策略在新场景中的成功率显著高于传统方法,展现了其在机器人操作中的潜力。

知识蒸馏RLDG:先基于精密任务训练RL策略(HIL-SERL),得到的RL数据去微调VLA,最终效果超越人类演示数据

结构之法 算法之道
结构之法 算法之道 · 2025-08-30T04:09:49Z

本文介绍了如何使用Notion创建健身记录看板,记录锻炼部位、次数和组数,并通过Notion API实现数据查询和自动化总结。用户可通过模板和按钮方便地记录和查看训练数据,提高健身管理效率。

巧用 Notion 搭建运动健身记录看板

少数派
少数派 · 2025-08-12T03:30:59Z
生僻字

文章探讨了大语言模型对生僻字的识别能力,关注训练数据是否涵盖所有汉字,并提及相关的汉字数字化和生僻字处理资源与平台。

生僻字

Tmr Blog
Tmr Blog · 2025-08-07T14:05:42Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码