小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
在日常设备上实现隐私保护的人工智能训练

麻省理工学院的研究人员开发了一种新方法,提升了联邦学习的效率,使其在资源有限的设备上更快地训练人工智能模型。该方法通过减少内存需求和通信负担,加速训练过程,平均提高了81%的速度。这项技术有望在医疗和金融等高风险领域应用,同时保护用户数据安全。

在日常设备上实现隐私保护的人工智能训练

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2026-04-29T04:00:00Z
你的数据正在喂养 AI:从 Atlassian 公告,看科技平台的数据训练默认政策

Atlassian 宣布默认使用用户数据训练 AI,引发行业关注。许多平台如 ChatGPT 和 GitHub Copilot 也采取类似政策,用户数据默认开启,退出路径复杂。企业需评估合规风险,建议使用企业版以保护数据。

你的数据正在喂养 AI:从 Atlassian 公告,看科技平台的数据训练默认政策

乱世浮生
乱世浮生 · 2026-04-28T23:31:27Z
DeepSeek-V4 技术解析:架构革新与 Coding Agent 后训练优化

DeepSeek-V4技术通过架构创新和后训练优化,显著提升了长上下文处理能力。其混合注意力机制和流形约束超连接提高了效率与稳定性。后训练阶段采用专家培养与全词表蒸馏,增强了Coding Agent的能力,提升了编程任务表现,标志着在长上下文与智能体能力结合上的重要进展。

DeepSeek-V4 技术解析:架构革新与 Coding Agent 后训练优化

jax - 走在路上
jax - 走在路上 · 2026-04-28T12:56:00Z
核心训练和腹肌训练是一个东西吗?

核心训练与腹肌训练不同,核心训练强调稳定性和抗阻力能力,涉及腹部、背部和臀部等肌肉,而腹肌训练主要针对腹部肌肉。核心稳定性有助于抵抗重力,减少肌肉代偿,降低受伤风险。尽管核心训练的效果尚无明确证据,但对普通人来说,锻炼核心是提升整体身体机能的重要方式。

核心训练和腹肌训练是一个东西吗?

極客死亡計劃
極客死亡計劃 · 2026-04-23T03:57:48Z
使用FastAPI训练、服务和部署Scikit-learn模型

本文介绍了如何使用FastAPI训练、服务和部署Scikit-learn模型。首先,创建项目结构并安装依赖。然后,使用乳腺癌数据集训练随机森林分类器并保存模型。接着,构建FastAPI服务器,提供健康检查和预测接口。最后,测试本地API并将其部署到FastAPI Cloud,确保API可用以处理生产流量。

使用FastAPI训练、服务和部署Scikit-learn模型

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-22T12:00:39Z

谷歌在Cloud Next发布了第八代自定义张量处理单元(TPU),包括TPU 8t和TPU 8i,分别针对大规模训练和低延迟推理任务进行优化。这些TPU旨在提高计算性能和能效,以满足AI代理的需求,推动AI模型的创新与应用,预计将在今年晚些时候推出。

我们的第八代TPU:为智能时代打造的两款芯片

The Keyword
The Keyword · 2026-04-22T12:00:00Z
谷歌将其TPU系列分为两种以适应智能时代

谷歌在Cloud Next上推出了TPU 8t和TPU 8i两款新芯片,分别针对训练和推理进行优化。TPU 8t适合训练,保持3D环形互连,而TPU 8i则提升内存带宽,专注于推理性能。谷歌认为,单一加速器无法同时满足这两种需求,分化是提升性价比的关键。新芯片支持裸金属访问,方便开发者使用。

谷歌将其TPU系列分为两种以适应智能时代

The New Stack
The New Stack · 2026-04-22T12:00:00Z

Decoupled DiLoCo是一种新型分布式架构,旨在提高大规模AI模型训练的效率和韧性。通过将训练任务分散到多个计算单元,系统能够在硬件故障时继续学习,避免通信延迟。该方法成功训练了120亿参数的模型,速度比传统方法快20倍,并支持不同代硬件的混合使用,提升计算资源利用率。

解耦DiLoCo:分布式AI训练的新前沿,具备韧性

Google DeepMind Blog
Google DeepMind Blog · 2026-04-22T10:20:03Z

大模型训练应视为流水线,分为数据工程、预训练、中训、微调和对齐等阶段。每个环节有不同的算力需求和挑战,数据质量至关重要。预训练需处理大量干净数据以确保模型稳定性,中训通过调整数据配比提升能力,微调教会模型理解指令,对齐阶段则使用多种算法优化模型表现。整体训练过程复杂,需关注数据、算力和工程细节。

【大模型基础设施工程】05:训练全景:Pre-train、SFT、RLHF、DPO、蒸馏

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

2024年,混合专家(MoE)架构成为大模型的主流,开源项目如Mixtral和DeepSeek推动了其发展。MoE通过减少激活参数显著降低计算成本,同时提升模型表达能力,适合算力充裕的场景。关键技术包括细粒度专家、共享专家和改进的负载均衡策略。未来,MoE将向更大规模和动态专家数发展。

【大模型基础设施工程】08:MoE 训练工程

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

本文探讨了大模型基础设施的演变,涵盖训练、推理、RAG和Agent等技术,介绍了适合工程师的新技术栈及其应用,包括开源和商业解决方案。

大模型基础设施工程

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

本文探讨了大模型基础设施的必要性与发展历程,强调大模型的特点,如计算和内存密集、状态重、故障常态化及高成本。系列文章将涵盖从硬件到应用的五层模型,帮助工程师理解大模型的工程化过程及其挑战。未来的工程创新将是降低成本的关键,推理侧的重要性将超过训练侧。

【大模型基础设施工程】01:大模型基础设施全景 —— 训练、推理、RAG、Agent、观测

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

ClawGUI是一个开源框架,旨在解决GUI智能体的训练、评测和部署问题。它通过在线强化学习与真实设备交互,提升模型性能。ClawGUI-2B在MobileWorld基准上取得17.1 SR的成绩,显著超越基线,并支持自然语言控制手机,推动GUI智能体的实际应用。

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

量子位
量子位 · 2026-04-19T04:25:19Z

现代人工智能训练采用分布式架构,利用多个GPU进行大规模神经网络训练。主要挑战在于高效分配工作负载和同步加速器。应用数据并行性、完全分片数据并行性和混合分片数据并行性等技术,以降低内存使用并提高效率。同时,激活检查点和上下文并行性等方法也用于优化内存和计算性能。

CS231n 讲义:大规模分布式训练

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-19T00:45:09Z

Cloudflare推出了“AI训练重定向”功能,通过将规范标签转化为301重定向,确保AI爬虫访问最新内容,改善AI生成答案的质量。用户可在Cloudflare仪表盘中轻松启用此功能。

AI训练重定向强制执行规范内容

The Cloudflare Blog
The Cloudflare Blog · 2026-04-17T13:00:00Z
MixAtlas:面向多模态大模型中期训练的基于不确定性的数 据混合优化

MixAtlas是一种用于多模态大模型中期训练的数据混合优化框架,通过领域分解和小型代理模型提高样本效率和下游泛化能力。它在图像概念和任务监督两个方面分解训练数据,显著提升训练效率,实现3倍的收敛速度和2-5%的性能提升,尤其在文本丰富的基准测试中表现突出。

MixAtlas:面向多模态大模型中期训练的基于不确定性的数 据混合优化

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-16T00:00:00Z

许多美国新闻媒体网站开始屏蔽互联网档案馆的时光机功能,以防止AI公司非法抓取内容用于模型训练。这一措施影响了用户访问历史网页的能力,并可能导致网站流量下降。媒体表示,这并非针对互联网档案馆,而是普遍屏蔽所有网络爬虫的措施,未来可能会有更多网站采取类似行动以保护自身权益。

大量新闻网站屏蔽互联网档案馆网站时光机保存快照 原因是被AI抓取训练模型

蓝点网
蓝点网 · 2026-04-14T03:00:44Z
大模型能“原地”改参数了!字节Seed&北大新论文:测试时推理无需加层重训练

字节Seed与北大合作提出“原地测试时训练”(In-Place TTT),使大模型在推理时无需重训练即可更新参数,从而提高计算效率和适应能力,尤其在长文本任务中效果显著。

大模型能“原地”改参数了!字节Seed&北大新论文:测试时推理无需加层重训练

量子位
量子位 · 2026-04-10T06:12:47Z
AI Gateway现支持团队级别的零数据保留和提示训练控制

AI Gateway现支持团队级别的零数据保留(ZDR),用户可在仪表板上启用ZDR,确保所有请求符合ZDR协议。团队级ZDR每千个请求收费0.10美元,按请求ZDR和禁止提示训练对所有用户免费。

AI Gateway现支持团队级别的零数据保留和提示训练控制

Vercel News
Vercel News · 2026-04-06T07:00:00Z
OpenAI新模型不是GPTX!全新预训练“土豆”曝光,Sora成弃子的原因找到了

OpenAI的新模型“土豆”将整合编程、浏览器和ChatGPT,专注于AGI的发展。放弃Sora是战略调整,重心转向Super App,以提升用户体验和解决复杂问题。未来几个月将逐步推出新功能,企业市场表现出强劲的付费意愿。

OpenAI新模型不是GPTX!全新预训练“土豆”曝光,Sora成弃子的原因找到了

量子位
量子位 · 2026-04-05T09:06:59Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码