小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
当200位具身从业者被拉进同一个屋子

具身智能的关注点已转向数据模型,数据采集面临认知对齐的挑战,模型训练需要大量真实数据。评测标准亟需统一,低分不一定代表模型性能差。未来应重视数据质量与复用性,推动无感化数据采集,以提升模型的泛化能力。

当200位具身从业者被拉进同一个屋子

量子位
量子位 · 2026-04-28T04:27:02Z
使用FastAPI训练、服务和部署Scikit-learn模型

本文介绍了如何使用FastAPI训练、服务和部署Scikit-learn模型。首先,创建项目结构并安装依赖。然后,使用乳腺癌数据集训练随机森林分类器并保存模型。接着,构建FastAPI服务器,提供健康检查和预测接口。最后,测试本地API并将其部署到FastAPI Cloud,确保API可用以处理生产流量。

使用FastAPI训练、服务和部署Scikit-learn模型

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-22T12:00:39Z
如何在PyCharm中训练您的第一个TensorFlow模型

本文介绍了如何在PyCharm中使用TensorFlow训练第一个模型。通过加载Fashion MNIST数据集,构建和训练简单的Keras模型,并比较其性能,使用可视化工具分析结果,帮助读者掌握TensorFlow的基本使用方法。

如何在PyCharm中训练您的第一个TensorFlow模型

The JetBrains Blog
The JetBrains Blog · 2026-04-07T10:36:35Z
大模型的损失函数为什么是交叉熵

大模型的损失函数主要是交叉熵,通过量化模型输出与预期的差距来评估性能。交叉熵与负对数似然(NLL)密切相关,都是衡量预测准确性的工具。训练目标是最小化损失值,以提高预测准确性。交叉熵从信息论角度评估模型分布与真实分布的一致性,确保模型能准确预测下一个词元。

大模型的损失函数为什么是交叉熵

木鸟杂记
木鸟杂记 · 2026-03-29T07:31:35Z
自己动手:构建一个训练真实模型的数据管道

数据在人工智能(AI)生态系统中至关重要,数据管道将原始数据转化为可用输出,支持模型训练和预测。数据不仅用于训练模型,还影响模型输出,推动AI系统的持续改进。本文介绍了构建数据模拟、使用线性回归训练模型及进行温度预测的方法,以帮助理解数据与AI的关系。

自己动手:构建一个训练真实模型的数据管道

The New Stack
The New Stack · 2026-03-28T13:00:00Z
数据集汇总丨英伟达/OpenAI及多所科研机构开源推理数据集,覆盖数学/全景空间/Wiki问答/科研任务/视觉常识等

大模型的发展凸显了推理数据的重要性,优质推理数据集支持复杂推理任务。HyperAI整理了多领域推理数据集,降低了使用门槛,促进科研与模型训练。

数据集汇总丨英伟达/OpenAI及多所科研机构开源推理数据集,覆盖数学/全景空间/Wiki问答/科研任务/视觉常识等

HyperAI超神经
HyperAI超神经 · 2026-03-27T09:49:53Z
Adobe的AI图像生成器现在可以根据您的艺术作品进行训练

Adobe推出了可定制的AI图像生成器Firefly自定义模型,允许创作者根据自己的资产训练模型,以保持角色设计和艺术风格的一致性。该工具旨在提高内容生产效率,确保视觉一致性,用户需确认拥有必要的版权和权限。

Adobe的AI图像生成器现在可以根据您的艺术作品进行训练

The Verge
The Verge · 2026-03-19T13:00:00Z
Ultralytics Platform发布,全面简化视觉AI工作流程

Ultralytics平台于3月18日发布,整合视觉AI生命周期,提供数据标注、模型训练和快速部署功能。核心包括智能数据标注、YOLO模型训练、灵活部署方案及监控仪表盘,用户可免费体验,采用积分制管理资源。

Ultralytics Platform发布,全面简化视觉AI工作流程

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-19T02:09:00Z
Kimi新架构让马斯克叹服!17岁高中生作者一战成名

17岁高中生陈广宇与Kimi团队提出的Attention Residuals技术,通过“旋转90度”改进注意力机制,提升模型训练效率25%。该论文引起马斯克和Karpathy的关注,展示了深度学习的新思路。

Kimi新架构让马斯克叹服!17岁高中生作者一战成名

量子位
量子位 · 2026-03-17T06:51:58Z
提升前沿大语言模型中的指令层级

AI系统需从多个来源接收指令,优先级排序至关重要。通过训练模型遵循系统、开发者、用户和工具的指令层级,可以提高安全性和可靠性。IH-Challenge数据集有助于模型处理指令冲突,增强对恶意指令的抵抗力,确保安全性。

提升前沿大语言模型中的指令层级

OpenAI
OpenAI · 2026-03-10T11:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第5部分:从研究到产品

本文介绍了如何使用qdrant-sparse-finetune工具化稀疏嵌入微调,以改善电子商务搜索。该工具简化了数据处理、模型训练和评估流程,支持自动化操作,提升用户体验。最终,用户可将模型快速发布到HuggingFace,实现28%的性能提升。

电子商务搜索中的稀疏嵌入微调 | 第5部分:从研究到产品

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z

大型语言模型(LLMs)如GPT-4的崛起改变了人工智能领域,数据工程在此过程中变得至关重要。处理非结构化数据并建立高质量数据管道是支持模型训练和推理的关键。数据科学家需关注数据质量、来源及其对模型行为的影响,以构建可靠的AI系统。

LLM时代的数据工程

KDnuggets
KDnuggets · 2026-03-02T15:00:37Z
ML.NET 快速入门与实践教程:机器学习框架

ML.NET是微软为.NET开发者设计的机器学习框架,支持C#。本文通过学生成绩预测案例,介绍数据加载、模型训练和评估流程,帮助开发者快速入门。

ML.NET 快速入门与实践教程:机器学习框架

dotNET跨平台
dotNET跨平台 · 2026-03-01T00:01:28Z
数据集汇总丨16个具身智能数据集,覆盖抓握/问答/逻辑推理/轨迹推理等领域

文章讨论了具身智能的研究进展,强调高质量数据集在模型训练中的重要性,并推荐了TongSIM-Asset、OmniRetarget和InternScenes等数据集,以推动具身智能的发展与应用。

数据集汇总丨16个具身智能数据集,覆盖抓握/问答/逻辑推理/轨迹推理等领域

HyperAI超神经
HyperAI超神经 · 2026-02-05T03:30:12Z

金山云星流平台全面升级为一站式AI训推平台,支持模型开发、训练和推理。预计到2028年,全球AI推理市场将达到1500亿美元,金山云凭借技术和服务能力,推动AI产业智能化升级及云计算发展。

金山云星流全面升级,以智算穿越云上AI新周期

量子位
量子位 · 2026-01-22T08:33:46Z
英伟达被指为训练 AI 大模型,曾寻求安娜的档案高速访问,数据规模达 500TB 级

几位书籍作者起诉英伟达,指控其侵犯版权并试图获取500TB盗版数据。诉讼称英伟达在模型训练中使用了盗版内容,面临法律压力。

英伟达被指为训练 AI 大模型,曾寻求安娜的档案高速访问,数据规模达 500TB 级

小众软件
小众软件 · 2026-01-20T08:29:09Z
nanobot-sft

本文讨论了纳米机器人在监督微调(SFT)中的应用,重点在于数据构造和模型训练过程。模型通过处理用户和助手消息学习生成合适的回复,并强调了在SFT阶段模型如何有效停止输出,提出了线性衰减的学习率策略以提高训练稳定性。

nanobot-sft

plus studio
plus studio · 2026-01-18T00:00:00Z
PatrickStar - 一个通过…实现大规模预训练模型并行训练的框架

PatrickStar是一个基于PyTorch的预训练模型并行训练框架,采用动态内存管理和异构训练策略,降低GPU内存使用,支持大模型训练,特别适合硬件受限环境下的预训练和大规模微调。

PatrickStar - 一个通过…实现大规模预训练模型并行训练的框架

云原生
云原生 · 2026-01-12T10:33:13Z

穹彻智能推出RoboPocket,结合手机与夹爪,实现便携式智能数据采集。该系统实时评估数据价值,优化采集过程,提高模型训练效率,使普通人也能参与数据采集,推动具身智能的社会化转变,解决数据质量与便捷性之间的矛盾。

具身智能数据战开打!每个普通人都能上手,边采边筛,只投喂机器人爱吃的丨穹彻

量子位
量子位 · 2026-01-12T04:53:54Z

鹿明机器人CTO丁琰在媒体沟通会上指出,具身智能模型训练的问题主要源于数据采集阶段。他介绍了UMI(通用操作接口)技术,旨在提升数据质量和采集效率,通过记录人类操作行为来解决数据孤岛和高成本问题。他强调数据质量对模型训练效果的直接影响,以及硬件、数据和算法之间的紧密关系。

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明丁琰

量子位
量子位 · 2026-01-09T05:25:46Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码