小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
科技爱好者周刊(第 399 期):中国 AI 大厂访问记

今年5月,美国访问团考察了14家中国AI和机器人公司,发现中国在算力方面受限于美国的芯片出口管制,导致研发进展缓慢。尽管中国公司在效率上有所提升,但整体算力仍落后于美国。中国AI市场对开源模型存在分歧,部分公司倾向于将大模型托管在云端而非开源。年轻研究人员对AGI持开放态度,认为安全问题应由政府解决。中国企业对AI服务的需求正在向云计算转变。

科技爱好者周刊(第 399 期):中国 AI 大厂访问记

阮一峰的网络日志
阮一峰的网络日志 · 2026-06-05T00:07:45Z
使用Scikit-LLM与开源语言模型

本文介绍如何使用Ollama本地托管的开源语言模型(如Llama 3、Mistral和Gemma)进行文本分类,避免支付API费用。内容包括Ollama的安装、Scikit-LLM库的配置,以及构建零样本文本分类器的步骤。通过简单的Python代码,用户可以实现模型的训练和预测,展示如何高效使用大型语言模型。

使用Scikit-LLM与开源语言模型

MachineLearningMastery.com
MachineLearningMastery.com · 2026-06-04T12:55:34Z
MiniMax M3一手实测:老黄PPT上74个Logo,我以为能难住它

MiniMax M3模型引发热议,提升了周用量限额并保持老用户设定。M3在长上下文、多模态和编程能力上表现突出,超越了GPT-5.5和Gemini 3.1 Pro,效率显著提高。M3成功复现多篇论文,展示了其强大的自主学习和实验能力。同时推出的MiniMax Code进一步增强了M3的功能。整体来看,M3在开源模型中具备竞争力,性价比高,成为开发者的新选择。

MiniMax M3一手实测:老黄PPT上74个Logo,我以为能难住它

量子位
量子位 · 2026-06-02T15:50:16Z

文章讨论了大语言模型(LLM)的可解释性,强调动态评估的重要性。尽管LLM在AI领域取得了突破,其内部运作仍不透明。研究者提出了基于SMILE的框架,通过分析用户输入的细微变化,提供模型决策的局部解释。同时,开发了使用开源模型的代理解决方案,以降低成本并实现模型可解释性。随着技术进步,LLM的可解释性正在快速发展,推动更可信的AI模型。

大语言模型可解释性入门

KDnuggets
KDnuggets · 2026-06-02T14:00:18Z
AI圈14个打脸时刻:套壳套到暴富,白领反而更抢手

AI应用层的价值显著提升,白领更受欢迎。技术人员应关注用户体验而非底层模型。开源模型已能满足大部分任务需求,AI智能体逐渐成熟,工作流工程师将取代提示词工程师。桌面应用回归,降低了使用门槛,未来AI工具将更加易用。

AI圈14个打脸时刻:套壳套到暴富,白领反而更抢手

极道
极道 · 2026-06-02T00:49:00Z
Mellum2 开源:一个快速的 AI 工作流模型

Mellum2是一个开源的12B模型,专为AI工作流设计,旨在解决生产AI中的延迟、吞吐量和成本问题。它专注于自然语言和代码,适用于软件工程环境,支持低延迟的AI任务路由、快速摘要和本地部署,以提高效率并降低计算成本。

Mellum2 开源:一个快速的 AI 工作流模型

The JetBrains Blog
The JetBrains Blog · 2026-06-01T12:57:50Z

稀宇科技推出的MiniMax-M3模型支持1M窗口,具备文本、图像和视频输入能力。基准测试显示其在编码任务上超越GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7。M3采用自研的稀疏注意力架构MSA,显著降低计算成本,未来将发布开源权重模型,强调长期协作和自主迭代能力。

稀宇科技推出MiniMax-M3模型 支持1M窗口在编码和智能体任务中表现突出

蓝点网
蓝点网 · 2026-06-01T03:07:23Z
看看目前本地能跑什么模型,使用llama.cpp

文章讨论了在本地运行小型开源模型的可行性,特别是使用llama.cpp项目。作者分享了在Windows上使用3060显卡运行Qwen3.6 9B模型的设置,包括CUDA版本和参数配置。尽管显存有限,这些模型在简单任务中仍能有效使用。

看看目前本地能跑什么模型,使用llama.cpp

Nicksxs's Blog
Nicksxs's Blog · 2026-05-31T14:07:14Z
τ0-WM:最大规模预训练的开源具身世界模型来了

上海创智学院的罗剑岚团队发布了全球最大规模的开源预训练具身世界模型τ0-WM,使用了17800小时的真机遥操作数据。该模型通过评估多个候选动作,提升了机器人在复杂任务中的成功率,推动了预训练与后训练的结合。

τ0-WM:最大规模预训练的开源具身世界模型来了

量子位
量子位 · 2026-05-31T07:38:43Z
在Databricks上通过提示缓存加速开源模型的LLM推理

在旧金山举行的全球最大数据、应用和人工智能活动中,研究人员探讨了提示缓存技术在大型语言模型(LLM)推理中的应用。提示缓存可以消除重复请求的冗余,提高模型在特定领域的质量,并降低计算成本。Databricks为开源模型提供此功能,确保安全性并自动优化性能,提升推理效率。

在Databricks上通过提示缓存加速开源模型的LLM推理

Databricks
Databricks · 2026-05-22T20:00:00Z
微软取消Claude Code内部授权!优步四个月花光一年预算

微软因AI使用成本激增,取消了内部Claude Code授权,优步在四个月内耗尽全年AI预算。企业面临AI费用上涨,需选择缩减使用或承担亏损。开源模型成为降低成本的替代方案。尽管长期来看AI成本可能下降,但短期内预算压力依然存在,企业需关注AI输出的可靠性。

微软取消Claude Code内部授权!优步四个月花光一年预算

极道
极道 · 2026-05-22T09:38:00Z
Gemini 3.5 Flash 发布:价格暴涨三倍,性价比神话破灭

谷歌推出的Gemini 3.5 Flash价格暴涨三倍,性价比大幅下降。尽管性能有所提升,但高昂的使用成本使用户更倾向于使用便宜的开源模型,开发者们开始转向本地部署模型以节省费用。这一举措可能导致用户信任度下降。

Gemini 3.5 Flash 发布:价格暴涨三倍,性价比神话破灭

极道
极道 · 2026-05-19T21:46:00Z

2026年,开发者面临token费用激增和API账单上涨。高端模型价格飙升,低端模型价格持续走低。智能体的使用导致token消耗量暴增,企业和个人开发者需通过多模型路由和输入压缩等方式降低成本。开源模型逐渐占据市场,合理使用AI可显著节省开支。

Token 冰火两重天:当你的 AI 账单开始按月翻倍

路边的阿不
路边的阿不 · 2026-05-14T15:48:41Z

微软的VS Code将默认启用AI协作者功能,自动在提交中添加“Co-Authored-by Copilot”标记,引发用户不满。梅赛德斯-奔驰回应用户对触控按键的不满,计划在新车型中恢复实体按键。加州将对违规的无人驾驶汽车开罚单,以提升公共安全。开源模型Kimi K2.6在编程挑战中表现优异,显示出开源技术的竞争力。

2026 05 04 HackerNews

介绍 on SuperTechFans
介绍 on SuperTechFans · 2026-05-04T00:39:35Z
腾讯开源手机端离线翻译模型,仅0.4G,支持33种语言

腾讯混元推出了开源的离线翻译模型Hy-MT1.5-1.8B-1.25bit,支持33种语言,压缩至440MB,翻译质量优于谷歌翻译。该模型可在手机本地运行,无需网络,适用于多种业务场景,并提供量化压缩方案,确保高效使用内存。

腾讯开源手机端离线翻译模型,仅0.4G,支持33种语言

量子位
量子位 · 2026-04-29T09:00:30Z
不卷参数卷架构,这个开源模型把图像理解和生成统一了

商汤推出了开源图像生成模型SenseNova-U1,具备高效的图文创作能力,支持复杂信息图和连贯的图文输出。其底层架构NEO-unify提升了创作效率。尽管存在局限,商汤将持续改进并已向公众开放该模型。

不卷参数卷架构,这个开源模型把图像理解和生成统一了

量子位
量子位 · 2026-04-29T04:27:03Z
全球首个医疗视频理解大模型开源!6k+组精标测试集与英雄榜同步上线,开发者速来!

uAI Nexus MedVLM是全球首个开源医疗视频理解大模型,能够准确分析手术视频,显著提升手术安全性和效率。该模型的发布标志着医疗视频理解领域的重要突破,促进了全球开发者的合作与技术进步。

全球首个医疗视频理解大模型开源!6k+组精标测试集与英雄榜同步上线,开发者速来!

量子位
量子位 · 2026-04-26T05:24:56Z

阿里通义发布的新模型Qwen3.6-27B拥有27亿参数,在代码修复测试中得分77.2,超越前代397亿参数模型的76.2分。该模型采用全参数激活的稠密架构,显存需求低至18GB,适合本地运行,降低了开发门槛。其原生多模态能力可处理文本、图像和视频,提升编程助手效率。开源协议为Apache 2.0,便于商业应用,可能改变开发者的使用方式。

27B参数跑赢397B,这个开源模型让本地部署有了新选择

dotNET跨平台
dotNET跨平台 · 2026-04-25T00:09:04Z
最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降

DeepSeek V4 发布,具备 1M 上下文和显著提升的代码能力,推理性能接近顶尖模型。新注意力机制降低计算需求,支持更多请求。V4 Pro 价格上涨,但在知识和推理任务上表现优异。现已上线官网和 API,无法自行部署。

最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降

小众软件
小众软件 · 2026-04-24T04:05:20Z
特斯拉开源硬件,中国公司回应来了:直接把机器人大脑开源了

智平方发布了全球首个开源具身智能模型社区AlphaBrain Platform,提供一整套顶尖技术工具,旨在简化开发者使用和比较模型的过程。该平台集成了五大核心技术,降低了训练门槛,支持持续学习,推动具身智能的应用落地。智平方的目标是成为行业标准的制定者,提升中国在具身智能领域的竞争力。

特斯拉开源硬件,中国公司回应来了:直接把机器人大脑开源了

量子位
量子位 · 2026-04-23T00:57:43Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码