小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
NVIDIA 发布 Nemotron 3.5 ASR:一个拥有 6 亿参数、支持缓存的流式转录模型,可实时转录 40 种语言区域设置

NVIDIA发布了Nemotron 3.5 ASR,这是一个支持40种语言的流式自动语音识别模型,拥有6亿参数。该模型采用FastConformer-RNNT架构,实时转录时无需单独处理标点和大小写,推理延迟可调,适合多种应用场景。经过微调,希腊语和保加利亚语的识别准确率显著提高。

NVIDIA 发布 Nemotron 3.5 ASR:一个拥有 6 亿参数、支持缓存的流式转录模型,可实时转录 40 种语言区域设置

实时互动网
实时互动网 · 2026-06-08T02:31:38Z

jiascheduler 是一个用 Rust 编写的高性能开源任务调度系统,支持海量节点管理和多种任务类型。v2.0.0 版本新增工作流支持,允许定时执行和图形化界面编辑,具备用户权限管理和团队协作等企业级功能,适用于运维自动化和混合云管理。项目免费开源,社区活跃。

jiascheduler 作业调度平台 v2.0.0 发布,支持 workflow 和作业作业参数

Rust.cc
Rust.cc · 2026-06-01T01:24:47Z

在去年的技术报告《Muon is Scalable for LLM Training》中,为了对比Muon与Adam所训练出来的模型的差异,我们引入了“奇异值熵”的概念,观察到Muon训练出来的...

矩阵参数的奇异值熵越高越好吗?

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2026-05-29T06:54:00Z

埃隆·马斯克透露,xAI将在未来2~3周发布新模型Grok V9-Medium,参数达到1.5万亿,显著提升编程能力。新模型整合了Cursor AI的开发者数据,改善复杂编码任务表现。SpaceX计划收购Cursor AI,以增强在AI编程市场的竞争力。Grok V9-Medium将优先面向订阅用户,后续逐步开放。

Grok 1.5T参数版新模型将在2~3周内发布 利用Cursor真实数据大幅度提高编码能力

蓝点网
蓝点网 · 2026-05-26T02:00:34Z

埃隆·马斯克宣布,xAI将在2026年底开源Grok 4.2模型。尽管其参数较小(500亿),但在自然语言处理和基础推理上表现良好。xAI的开源策略优先考虑商业利益,确保新模型发布后再开源旧模型,以防止竞争对手复制和滥用。

埃隆马斯克宣布将在年底开源Grok 4.2基座模型 尽管参数规模较小但仍有实用价值

蓝点网
蓝点网 · 2026-05-26T01:30:34Z
将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

面壁智能推出的BitCPM-CANN三值大模型显著降低显存需求,最高可节省6倍,同时保留97%的模型能力。该模型首次在华为昇腾平台上完成训练,支持多种应用场景,从手机到PC。通过三值量化技术,模型在保持性能的同时显著减少内存占用,为AI在终端设备的应用提供了新可能。

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

爱范儿
爱范儿 · 2026-05-25T04:05:47Z
克里斯托夫·佩图斯:所有的GUC参数一览:client_connection_check_interval

PostgreSQL 14引入了client_connection_check_interval参数,默认关闭。该参数定期检查客户端连接状态,避免长时间运行的查询在客户端断开后继续执行,造成资源浪费。建议在运行长查询的集群中将其设置为10秒,以提高资源利用效率。

克里斯托夫·佩图斯:所有的GUC参数一览:client_connection_check_interval

Planet PostgreSQL
Planet PostgreSQL · 2026-05-25T01:00:00Z
克里斯托夫·佩图斯:你的所有GUC参数一览:client_encoding

本文讨论了PostgreSQL中的client_encoding参数及其重要性。该参数决定客户端与服务器之间的字符编码转换,默认情况下为服务器编码。若编码不匹配,可能导致数据转换错误。建议在连接字符串或环境变量中设置client_encoding,以避免潜在问题。现代客户端库通常默认使用UTF-8,推荐保持此设置以简化操作。

克里斯托夫·佩图斯:你的所有GUC参数一览:client_encoding

Planet PostgreSQL
Planet PostgreSQL · 2026-05-24T01:00:00Z
克里斯托夫·佩图斯:所有的GUC参数一览:checkpoint_flush_after和checkpoint_warning

文章讨论了PostgreSQL中的两个检查点参数:checkpoint_flush_after和checkpoint_warning。checkpoint_flush_after控制写回操作,默认值为256kB,建议在Linux上保持不变。checkpoint_warning是日志参数,用于警告检查点过于频繁,默认值为30秒,建议在出现警告时增加max_wal_size。

克里斯托夫·佩图斯:所有的GUC参数一览:checkpoint_flush_after和checkpoint_warning

Planet PostgreSQL
Planet PostgreSQL · 2026-05-23T01:00:00Z
克里斯托夫·佩图斯:将所有GUC参数一一列出:checkpoint_timeout和checkpoint_completion_target

本文讨论了PostgreSQL中的两个重要检查点参数:checkpoint_timeout和checkpoint_completion_target。检查点是确保脏页写入磁盘的时刻,影响崩溃恢复时间。建议将checkpoint_timeout设置为至少15分钟,以减少写放大和I/O负担,同时将checkpoint_completion_target设置为0.9,以平滑I/O负载。合理配置可提高系统性能和稳定性。

克里斯托夫·佩图斯:将所有GUC参数一一列出:checkpoint_timeout和checkpoint_completion_target

Planet PostgreSQL
Planet PostgreSQL · 2026-05-22T01:00:00Z
智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速

智象未来在北京发布了图像大模型HiDream-O1-Image-Pro,该模型基于原生全模态架构,参数超过200亿,刷新多项基准测试纪录。公司完成新一轮融资,显示市场对原生全模态模型的信心。该模型通过统一图像、文本和任务条件,提升生成和泛化能力,推动AI向理解和构建世界的方向发展。

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速

量子位
量子位 · 2026-05-20T14:09:25Z
Free CPU教程丨狂揽8.8k stars,TTS模型Supertonic-3参数规模仅约99M,支持31种语言

随着生成式AI向多模态发展,Supertone团队推出的Supertonic-3模型支持31种语言,具备实时语音合成能力,参数仅为9900万。该模型可在CPU环境中运行,无需云API,适合开发本地AI助手和语音播报系统。

Free CPU教程丨狂揽8.8k stars,TTS模型Supertonic-3参数规模仅约99M,支持31种语言

HyperAI超神经
HyperAI超神经 · 2026-05-20T10:55:40Z
克里斯托夫·佩图斯:所有的GUC参数:bonjour和bonjour_name

PostgreSQL的bonjour和bonjour_name参数用于通过Apple的Bonjour协议在本地网络上广告数据库。虽然适合小型会议和家庭实验室,但在生产环境中不推荐使用,因存在安全风险,建议保持关闭。

克里斯托夫·佩图斯:所有的GUC参数:bonjour和bonjour_name

Planet PostgreSQL
Planet PostgreSQL · 2026-05-19T01:00:00Z
吃一堑长一智.skill —— 那一秒,是改大脑参数最好的时机

文章讨论了如何通过“吃一堑长一智”技能调整大脑参数,以应对错误和改变行为模式。作者提出五个步骤,帮助用户识别错误、分析反应、调整思维模式,并形成新的行为习惯。强调在情绪高涨时调整参数的有效性,并建议使用AI工具辅助这一过程。

吃一堑长一智.skill —— 那一秒,是改大脑参数最好的时机

王建硕的博客
王建硕的博客 · 2026-05-16T01:02:00Z
何恺明首个语言模型:不走GPT老路,105M参数干翻主流

何恺明团队推出了首个扩散语言模型ELF,采用105M参数和45B训练token,成功超越主流模型。ELF通过在连续空间中去噪生成离散token,显著提高生成速度和质量,展示了小规模模型的高效输出,降低了训练成本,未来有望推动AI生成速度提升。

何恺明首个语言模型:不走GPT老路,105M参数干翻主流

dotNET跨平台
dotNET跨平台 · 2026-05-14T23:58:43Z
何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明团队推出了新的扩散语言模型ELF,该模型采用连续的embedding空间进行文本生成,显著降低了生成困惑度。ELF在训练和采样效率上表现优异,仅用105M参数和45B训练token,生成质量超过主流模型。该模型首次实现了连续与离散的有效结合,推动了扩散语言模型的发展。

何恺明首个语言模型:105M参数,不走GPT自回归老路

量子位
量子位 · 2026-05-13T01:23:32Z

文章讨论了手冲咖啡的冲煮技巧,特别是世界咖啡冲煮大赛冠军的创新方法。强调变温多段萃取和简化手法的重要性,介绍了「四六法」和「无差别冲煮法」等实用技巧,旨在帮助咖啡爱好者提升冲煮水平,制作更美味的咖啡。

手冲咖啡进阶指北:如何让「冠军参数」变成「你的日常」

少数派
少数派 · 2026-05-11T07:22:59Z
幂等性实战:同一个请求Key带着不同参数来了怎么办?

本文探讨了幂等性在支付接口中的重要性,强调处理重复请求时的挑战。确保每个请求的唯一性和状态管理是关键,以避免重复执行导致的错误。通过数据库行锁、命令哈希和状态机等技术,系统能够正确识别和处理不同请求,防止重复扣款或错误响应。此外,设定请求的有效期和处理失败的策略,有助于增强系统的可靠性和用户体验。

幂等性实战:同一个请求Key带着不同参数来了怎么办?

极道
极道 · 2026-05-11T01:09:00Z
Redis之父antirez发布DeepSeek V4 Flash专用推理引擎,128GB MacBook本地跑284B参数大模型

意大利程序员Salvatore Sanfilippo(antirez)发布了新开源项目ds4.c,专为DeepSeek V4 Flash设计的推理引擎。该项目利用Metal GPU,支持高达100万Token的上下文窗口,推理速度极快,适合长文档处理。ds4.c提供CLI和服务器模式,支持本地HTTP服务和磁盘KV缓存,提升了Agent客户端的使用体验。

Redis之父antirez发布DeepSeek V4 Flash专用推理引擎,128GB MacBook本地跑284B参数大模型

dotNET跨平台
dotNET跨平台 · 2026-05-10T00:01:48Z
不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件

启发式学习(HL)是一种新型强化学习方法,成功在Atari游戏中取得高分。HL通过代码编辑替代梯度更新,实现显式决策逻辑,克服了深度强化学习的灾难性遗忘和不可解释性问题,尤其在复杂控制场景中表现出强适应能力。未来,HL与神经网络的结合将推动在线学习与持续学习的发展。

不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件

量子位
量子位 · 2026-05-09T08:07:08Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码