小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
社区语言变迁背后:从权重到提示词再到“harness”底层逻辑解析!

AI能力的演变从模型内部向外部系统转移,关注点从模型的知识转向如何组织模型的行动。当前的“harness”阶段标志着能力外移,模型被视为推理引擎,真正的智能分布在外部结构中。未来可能会出现自组织系统,智能的边界将不断扩展。

社区语言变迁背后:从权重到提示词再到“harness”底层逻辑解析!

极道
极道 · 2026-04-13T08:55:00Z
AI模型的权重:基础设施为何总是滞后

随着AI在各行业的快速应用,企业在管理和分发大型模型权重文件时面临挑战。现有模型存储方法未能与Kubernetes原生交付结合,导致部署脆弱和安全风险。文章提出了一种云原生解决方案,将模型权重视为OCI工件,利用容器工具链实现高效管理和分发,提升AI模型的生命周期管理。

AI模型的权重:基础设施为何总是滞后

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-27T11:00:00Z
AI功能在用户购买决策中的权重已与传统硬件参数并重

益普索与京东的《AI消费电子产品消费洞察报告》显示,用户对AI的认知已从“概念好奇”转向“场景依赖”。报告指出,工作、娱乐、教育等六大场景推动需求,AI功能在购买决策中与传统硬件参数同等重要,47%的用户关注AI的实用性,近50%的消费者希望AI功能无缝融入生活。

AI功能在用户购买决策中的权重已与传统硬件参数并重

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-13T03:27:55Z
AWS 一周综述:Amazon EC2 M8azn 实例,Amazon Bedrock 中的新开放权重模型等(2026 年 2 月 16 日)

我于2021年加入AWS,见证了Amazon EC2实例的快速发展。最新的M8azn实例基于AMD EPYC处理器,性能显著提升,适合高性能计算任务。此外,AWS还推出了Amazon Bedrock的开放权重模型和EKS自动模式的日志增强等新功能。

AWS 一周综述:Amazon EC2 M8azn 实例,Amazon Bedrock 中的新开放权重模型等(2026 年 2 月 16 日)

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-02-16T05:20:07Z

反向传播的主要目标是计算网络中每个权重和偏置的成本函数偏导数。通过矩阵形式简化推导,定义了激活向量、加权输入向量、权重矩阵和偏置向量等符号。推导过程包括输出层误差、隐藏层误差传播,以及偏置和权重的梯度计算,最终形成误差向量与输入激活向量的外积。

反向传播:向量微积分视角

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T22:45:09Z
从cgroup v1 CPU Shares到cgroup v2 CPU权重的新转换

Kubernetes改进了cgroup v1到cgroup v2的CPU权重公式,解决了CPU优先级分配问题,提升了优先级和粒度,使请求1 CPU的容器获得接近默认值的权重,改善资源分配。此变更需OCI运行时支持,建议在非生产环境中测试。

从cgroup v1 CPU Shares到cgroup v2 CPU权重的新转换

Kubernetes Blog
Kubernetes Blog · 2026-01-30T16:00:00Z

OpenAI开源的新模型采用Circuit Sparsity技术,使99.9%的权重为零,提升了模型的可解释性。通过严格的连接约束,简化了计算过程,解决了传统模型的黑箱问题。尽管计算成本较高,但未来有望实现更复杂的推理。

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

量子位
量子位 · 2025-12-14T06:27:09Z
亚马逊云科技在Amazon Bedrock中新增18款开放权重模型

亚马逊云科技在2025 re:Invent大会上宣布,Amazon Bedrock新增18款开放权重模型,包括Mistral Large 3和Ministral 3系列,进一步丰富全托管模型选择。

亚马逊云科技在Amazon Bedrock中新增18款开放权重模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-12-11T02:56:36Z
Amazon Bedrock 新增 18 个完全托管式开放权重模型,包括新的 Mistral Large 3 和 Ministral 3 模型

今天,Amazon Bedrock 正式推出来自多家公司的 18 个开放权重模型,包括 Mistral Large 3 和 Ministral 3 系列。客户可以根据需求选择模型,支持无服务器访问,优化性能和成本,适用于多种应用场景。

Amazon Bedrock 新增 18 个完全托管式开放权重模型,包括新的 Mistral Large 3 和 Ministral 3 模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-11T02:55:48Z

权重衰减和学习率在大语言模型预训练中至关重要。本文从滑动平均的角度探讨如何合理设置这两个参数,以增强模型的记忆能力,避免遗忘早期数据,同时防止欠拟合和权重爆炸。

滑动平均视角下的权重衰减和学习率

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-12-05T05:17:00Z
大模型时代的开源:从开放代码到开放权重的演进

真正的开源应具备可重现、可验证和可共创的特性,而不仅仅是可下载。在AI时代,许多模型虽然开放权重,但未公开训练数据和代码,导致“开源”与“开放权重”之间存在差异。传统开源强调源码的完整性和可重现性,而AI时代则更注重权重的开放性和可验证性。

大模型时代的开源:从开放代码到开放权重的演进

云原生
云原生 · 2025-11-02T09:45:00Z
大数据成矿预测系列(二) | 证据权重法如何克服自身局限?

证据权重法(WofE)在成矿预测中存在理论缺陷,特别是证据层之间的条件独立性假设不成立,导致系统性偏倚和虚假精确感。为解决这些问题,研究者提出了模糊证据权重法、序列证据权重法和混合模型等改进方法,以提高预测的准确性和适用性。然而,WofE仍面临对已知矿床样本依赖等挑战。

大数据成矿预测系列(二) | 证据权重法如何克服自身局限?

Seraphineの小窝
Seraphineの小窝 · 2025-10-01T10:01:16Z
通过模仿模型权重评估样本效用以进行数据选择

本文提出了一种基于Mimic Score的新数据选择方法,旨在优化大规模网络数据集中的样本选择,以提高数据效率。该方法通过参考模型权重评估样本质量,并在六个图像数据集上实现了性能提升。

通过模仿模型权重评估样本效用以进行数据选择

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-23T00:00:00Z
亚马逊云科技在Amazon Bedrock上线Qwen3和DeepSeek-V3.1开放权重模型

亚马逊云科技在Amazon Bedrock上新增Qwen3和DeepSeek-V3.1开放权重模型,扩展了模型阵容。Qwen3系列模型支持多步骤工作流规划和长上下文处理,而DeepSeek-V3.1则提供混合推理能力,提升AI透明度和灵活性。

亚马逊云科技在Amazon Bedrock上线Qwen3和DeepSeek-V3.1开放权重模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-09-19T02:55:32Z

文章讨论了对StarBlog搜索功能的改进,采用手动计算权重和正则表达式高亮显示搜索结果,优化了搜索逻辑和界面,提升了用户体验。未来计划开发v2版本,可能加入多个关键词搜索功能。

重写 StarBlog 的搜索功能和页面,支持权重设置和结果高亮

dotNET跨平台
dotNET跨平台 · 2025-09-03T23:59:09Z

文章讨论了对StarBlog搜索功能的改进,采用内存计算权重和正则表达式实现高亮,提升了搜索效果。当前方案虽简陋,但为快速实现而选用,未来计划开发新版以增强功能。

重写 StarBlog 的搜索功能和页面,支持权重设置和结果高亮 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2025-09-02T14:50:00Z
Nous Research 发布 Hermes 4:具有混合推理能力的开放权重 AI 模型系列

Nous Research发布的Hermes 4是一个开放权重模型系列,采用后训练技术,具备混合推理能力。核心组件DataForge通过有向无环图生成合成数据,显著提升推理样本质量。Hermes 4在多个基准测试中表现优异,展现了开源AI的潜力与中立性。

Nous Research 发布 Hermes 4:具有混合推理能力的开放权重 AI 模型系列

实时互动网
实时互动网 · 2025-08-29T02:42:52Z
xAI 释出 Grok 2.5 模型权重,预计半年后开源 Grok 3

马斯克创立的AI公司xAI已将Grok 2.5模型权重上传至Hugging Face,并计划在约六个月后开源Grok 3。Grok 2.5是去年的最佳模型,但因社交媒体上的争议,xAI决定对其进行重新训练,以清理训练数据中的“垃圾”。

xAI 释出 Grok 2.5 模型权重,预计半年后开源 Grok 3

myfreax
myfreax · 2025-08-25T05:13:30Z

本文介绍了一种新型强化学习算法——群体序列策略优化(GSPO),旨在提升大型语言模型的训练稳定性和效率。GSPO通过基于序列概率定义重要性比率,解决了GRPO算法的稳定性问题,显著提高了Qwen3模型的性能。

一文通透GSPO——Qwen3所用的“群体序列策略优化”:摒弃token级别的off-policy校正,而在序列级别利用重要性权重进行优化

结构之法 算法之道
结构之法 算法之道 · 2025-08-25T04:42:10Z
“超级权重”:单个参数如何决定大型语言模型的行为

苹果研究人员的论文指出,少量“超级权重”在大型语言模型(LLM)中对功能影响显著。识别这些权重有助于模型压缩,提升资源受限设备的性能。研究表明,保留超级权重和激活可显著改善压缩质量,推动未来研究。

“超级权重”:单个参数如何决定大型语言模型的行为

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码