小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Modular:零日:MiniMax M3在Modular云上的开放权重

MiniMax M3是最新的开源模型,优化了编码和多模态任务。其稀疏注意力机制显著提高了计算效率,减少了每个令牌的计算需求,提升了速度。该模型在Modular平台上可供企业客户使用,支持实时患者对话的灵活推理。

Modular:零日:MiniMax M3在Modular云上的开放权重

Modular Blog
Modular Blog · 2026-06-11T00:00:00Z
Miso Labs发布MisoTTS:一款拥有开放权重的80亿情感文本转语音模型

Miso Labs发布了MisoTTS,这是一款拥有80亿参数的文本转语音模型,采用残差矢量量化技术,能够根据文本和音频上下文生成富有表现力的语音。该模型的词汇量可扩展至约2048³²,支持半双工传输,API访问正在开发中。

Miso Labs发布MisoTTS:一款拥有开放权重的80亿情感文本转语音模型

实时互动网
实时互动网 · 2026-06-05T03:07:15Z
Galaxea G0.5——升级“VLA自回归建模”范式:摒弃VLM上添加动作专家的模式,而是构建统一模型,用一套权重,在同一个自回归token序列中同时生成推理与动作(含VLA-0的详解)

星海图提出的G0.5模型将视觉语言模型与动作生成统一为单一自回归序列,通过共享权重实现推理与动作的耦合,提升机器人控制效率。该模型采用可学习的动作分词器和视觉记忆模块,优化动作生成过程,减少离散化负担,能够在零样本条件下分解任务,直接生成动作,增强对复杂场景的适应能力。

Galaxea G0.5——升级“VLA自回归建模”范式:摒弃VLM上添加动作专家的模式,而是构建统一模型,用一套权重,在同一个自回归token序列中同时生成推理与动作(含VLA-0的详解)

结构之法 算法之道
结构之法 算法之道 · 2026-06-04T10:18:09Z
他们是由权重构成的:一篇让你重新思考AI与人类的文章

本文探讨了大语言模型的核心原理,强调知识和推理能力分布在权重网络中,而非独立模块。通过类比人类大脑,讨论了意识的涌现理论及人类对AI的情感投射,指出人类对自身智能的理解仍存在许多未解之谜。

他们是由权重构成的:一篇让你重新思考AI与人类的文章

极道
极道 · 2026-06-04T06:01:00Z
社区语言变迁背后:从权重到提示词再到“harness”底层逻辑解析!

AI能力的演变从模型内部向外部系统转移,关注点从模型的知识转向如何组织模型的行动。当前的“harness”阶段标志着能力外移,模型被视为推理引擎,真正的智能分布在外部结构中。未来可能会出现自组织系统,智能的边界将不断扩展。

社区语言变迁背后:从权重到提示词再到“harness”底层逻辑解析!

极道
极道 · 2026-04-13T08:55:00Z
AI模型的权重:基础设施为何总是滞后

随着AI在各行业的快速应用,企业在管理和分发大型模型权重文件时面临挑战。现有模型存储方法未能与Kubernetes原生交付结合,导致部署脆弱和安全风险。文章提出了一种云原生解决方案,将模型权重视为OCI工件,利用容器工具链实现高效管理和分发,提升AI模型的生命周期管理。

AI模型的权重:基础设施为何总是滞后

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-27T11:00:00Z
AI功能在用户购买决策中的权重已与传统硬件参数并重

益普索与京东的《AI消费电子产品消费洞察报告》显示,用户对AI的认知已从“概念好奇”转向“场景依赖”。报告指出,工作、娱乐、教育等六大场景推动需求,AI功能在购买决策中与传统硬件参数同等重要,47%的用户关注AI的实用性,近50%的消费者希望AI功能无缝融入生活。

AI功能在用户购买决策中的权重已与传统硬件参数并重

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-13T03:27:55Z
AWS 一周综述:Amazon EC2 M8azn 实例,Amazon Bedrock 中的新开放权重模型等(2026 年 2 月 16 日)

我于2021年加入AWS,见证了Amazon EC2实例的快速发展。最新的M8azn实例基于AMD EPYC处理器,性能显著提升,适合高性能计算任务。此外,AWS还推出了Amazon Bedrock的开放权重模型和EKS自动模式的日志增强等新功能。

AWS 一周综述:Amazon EC2 M8azn 实例,Amazon Bedrock 中的新开放权重模型等(2026 年 2 月 16 日)

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-02-16T05:20:07Z

反向传播的主要目标是计算网络中每个权重和偏置的成本函数偏导数。通过矩阵形式简化推导,定义了激活向量、加权输入向量、权重矩阵和偏置向量等符号。推导过程包括输出层误差、隐藏层误差传播,以及偏置和权重的梯度计算,最终形成误差向量与输入激活向量的外积。

反向传播:向量微积分视角

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T22:45:09Z
从cgroup v1 CPU Shares到cgroup v2 CPU权重的新转换

Kubernetes改进了cgroup v1到cgroup v2的CPU权重公式,解决了CPU优先级分配问题,提升了优先级和粒度,使请求1 CPU的容器获得接近默认值的权重,改善资源分配。此变更需OCI运行时支持,建议在非生产环境中测试。

从cgroup v1 CPU Shares到cgroup v2 CPU权重的新转换

Kubernetes Blog
Kubernetes Blog · 2026-01-30T16:00:00Z

OpenAI开源的新模型采用Circuit Sparsity技术,使99.9%的权重为零,提升了模型的可解释性。通过严格的连接约束,简化了计算过程,解决了传统模型的黑箱问题。尽管计算成本较高,但未来有望实现更复杂的推理。

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

量子位
量子位 · 2025-12-14T06:27:09Z
亚马逊云科技在Amazon Bedrock中新增18款开放权重模型

亚马逊云科技在2025 re:Invent大会上宣布,Amazon Bedrock新增18款开放权重模型,包括Mistral Large 3和Ministral 3系列,进一步丰富全托管模型选择。

亚马逊云科技在Amazon Bedrock中新增18款开放权重模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-12-11T02:56:36Z
Amazon Bedrock 新增 18 个完全托管式开放权重模型,包括新的 Mistral Large 3 和 Ministral 3 模型

今天,Amazon Bedrock 正式推出来自多家公司的 18 个开放权重模型,包括 Mistral Large 3 和 Ministral 3 系列。客户可以根据需求选择模型,支持无服务器访问,优化性能和成本,适用于多种应用场景。

Amazon Bedrock 新增 18 个完全托管式开放权重模型,包括新的 Mistral Large 3 和 Ministral 3 模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-11T02:55:48Z

权重衰减和学习率在大语言模型预训练中至关重要。本文从滑动平均的角度探讨如何合理设置这两个参数,以增强模型的记忆能力,避免遗忘早期数据,同时防止欠拟合和权重爆炸。

滑动平均视角下的权重衰减和学习率

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-12-05T05:17:00Z
大模型时代的开源:从开放代码到开放权重的演进

真正的开源应具备可重现、可验证和可共创的特性,而不仅仅是可下载。在AI时代,许多模型虽然开放权重,但未公开训练数据和代码,导致“开源”与“开放权重”之间存在差异。传统开源强调源码的完整性和可重现性,而AI时代则更注重权重的开放性和可验证性。

大模型时代的开源:从开放代码到开放权重的演进

云原生
云原生 · 2025-11-02T09:45:00Z
大数据成矿预测系列(二) | 证据权重法如何克服自身局限?

证据权重法(WofE)在成矿预测中存在理论缺陷,特别是证据层之间的条件独立性假设不成立,导致系统性偏倚和虚假精确感。为解决这些问题,研究者提出了模糊证据权重法、序列证据权重法和混合模型等改进方法,以提高预测的准确性和适用性。然而,WofE仍面临对已知矿床样本依赖等挑战。

大数据成矿预测系列(二) | 证据权重法如何克服自身局限?

Seraphineの小窝
Seraphineの小窝 · 2025-10-01T10:01:16Z
通过模仿模型权重评估样本效用以进行数据选择

本文提出了一种基于Mimic Score的新数据选择方法,旨在优化大规模网络数据集中的样本选择,以提高数据效率。该方法通过参考模型权重评估样本质量,并在六个图像数据集上实现了性能提升。

通过模仿模型权重评估样本效用以进行数据选择

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-23T00:00:00Z
亚马逊云科技在Amazon Bedrock上线Qwen3和DeepSeek-V3.1开放权重模型

亚马逊云科技在Amazon Bedrock上新增Qwen3和DeepSeek-V3.1开放权重模型,扩展了模型阵容。Qwen3系列模型支持多步骤工作流规划和长上下文处理,而DeepSeek-V3.1则提供混合推理能力,提升AI透明度和灵活性。

亚马逊云科技在Amazon Bedrock上线Qwen3和DeepSeek-V3.1开放权重模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-09-19T02:55:32Z

文章讨论了对StarBlog搜索功能的改进,采用手动计算权重和正则表达式高亮显示搜索结果,优化了搜索逻辑和界面,提升了用户体验。未来计划开发v2版本,可能加入多个关键词搜索功能。

重写 StarBlog 的搜索功能和页面,支持权重设置和结果高亮

dotNET跨平台
dotNET跨平台 · 2025-09-03T23:59:09Z

文章讨论了对StarBlog搜索功能的改进,采用内存计算权重和正则表达式实现高亮,提升了搜索效果。当前方案虽简陋,但为快速实现而选用,未来计划开发新版以增强功能。

重写 StarBlog 的搜索功能和页面,支持权重设置和结果高亮 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2025-09-02T14:50:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码