小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
谷歌Gemma 4 12B的性能几乎与26B基准相当——并可在您的笔记本电脑上运行

谷歌推出了Gemma 4 12B模型,旨在为标准笔记本电脑提供高性能的多模态智能。该模型内存占用比Gemma 4 26B小一半,但性能接近,支持本地运行,适合开发者使用。其统一架构可直接处理音频和图像输入,减少延迟和内存使用,吸引了开发者的关注。

谷歌Gemma 4 12B的性能几乎与26B基准相当——并可在您的笔记本电脑上运行

The New Stack
The New Stack · 2026-06-04T19:30:19Z
本地多模态拳王Gemma 4 12B评测 | 无编码器架构详解

谷歌最新的Gemma 4 12B是一款轻量级多模态AI模型,采用无编码器架构,能够直接处理图像和音频,提升了效率和理解能力。其120亿参数使其在普通电脑上运行成为可能,具备高效、快速的响应能力,并支持本地运行,确保隐私和安全。Gemma 4 12B适合个人用户和开发者,具有极高的可定制性。

本地多模态拳王Gemma 4 12B评测 | 无编码器架构详解

极道
极道 · 2026-06-03T23:29:00Z

Gemma 4 12B是最新的多模态智能模型,专为笔记本电脑设计,具备强大的推理能力和音频输入。它采用无编码架构,减少延迟和内存使用,支持在16GB内存的设备上本地运行。该模型已获得150百万次下载,开发者可利用其功能构建各种应用。

介绍Gemma 4 12B:一个统一的无编码多模态模型

The Keyword
The Keyword · 2026-06-03T16:00:00Z
DeepSeek V4 Flash专用推理引擎ds4.c完全指南:本地跑大模型的新玩法

本文介绍了ds4.c,一个为DeepSeek V4 Flash模型设计的轻量级推理引擎。该引擎支持本地运行,具备超长上下文和高效的KV缓存,能够快速处理复杂问题。与云端API相比,本地运行更安全、无延迟且无额外费用,适合对隐私和性能有高要求的用户。尽管目前仍处于alpha版本,作者欢迎用户测试和反馈。

DeepSeek V4 Flash专用推理引擎ds4.c完全指南:本地跑大模型的新玩法

极道
极道 · 2026-05-07T22:48:00Z
69个开源AI工具大盘点2026年4月版 - 省下每年5万美金订阅费的开源方案

2026年4月,推荐了69个开源AI工具,包括Ollama、vLLM、LM Studio等,适用于本地运行大模型和推理引擎,帮助用户每年节省高达5万美元的订阅费。这些工具强调了开源的灵活性和成本效益,适合不同需求的开发者和企业。

69个开源AI工具大盘点2026年4月版 - 省下每年5万美金订阅费的开源方案

极道
极道 · 2026-04-30T06:51:00Z
用 OpenVINO 打通 ComfyUI + ERNIE-Image:Intel CPU 和 GPU 也能快速本地生图

本文介绍了如何在没有CUDA环境的情况下,通过ComfyUI和OpenVINO在Intel平台上本地运行ERNIE-Image模型。该项目简化了安装和使用流程,用户只需按照步骤准备模型、启动ComfyUI并添加节点,即可快速生成图像,适合希望快速验证工作流的开发者。

用 OpenVINO 打通 ComfyUI + ERNIE-Image:Intel CPU 和 GPU 也能快速本地生图

百度大脑
百度大脑 · 2026-04-24T11:33:52Z
Agent Framework 接入 Ollama(本地模型实践记录)

Ollama 是一个本地运行大模型的工具,适合处理敏感数据和成本敏感的项目。安装后,Ollama 启动本地服务,用户可通过 API 调用模型。将 Ollama 集成到 Agent Framework 后,可以灵活地在本地完成 AI 调用链路,增强数据控制和可控性。

Agent Framework 接入 Ollama(本地模型实践记录)

dotNET跨平台
dotNET跨平台 · 2026-04-16T00:01:38Z
OpenClaw免费合法使用教程:零成本运行AI代理的终极指南

本文介绍了如何合法且低成本地使用OpenClaw和AI模型。通过本地运行小模型、利用免费API和学术计划,用户可以将每月成本控制在十美元以内。文章强调混合使用本地和云端资源的优势,建议用户动手实践以提升技术能力,并警惕不安全的免费服务和隐私风险。

OpenClaw免费合法使用教程:零成本运行AI代理的终极指南

极道
极道 · 2026-04-15T23:19:00Z
技术速递|oBeaver —— 一只可以在你本地机器上运行大语言模型的海狸 [特殊字符]

oBeaver 是一个本地运行大语言模型的工具,旨在避免云端数据传输。它基于 ONNX Runtime,支持多平台和 NPU 加速,提供简便的模型转换和推理功能,兼容 OpenAI API。oBeaver 结合了 Microsoft Foundry Local 和 ONNX Runtime,适用于多种场景,未来将增强 GPU 和 NPU 支持。

技术速递|oBeaver —— 一只可以在你本地机器上运行大语言模型的海狸 [特殊字符]

dotNET跨平台
dotNET跨平台 · 2026-04-11T01:57:28Z
如何使用Ollama在本地运行和自定义大型语言模型(LLMs)

大型语言模型(LLMs)是强大的人工智能系统,能够在本地离线运行,确保数据隐私并降低成本。本文介绍了如何使用Ollama设置本地LLMs,包括安装、管理和自定义模型,适合开发者和AI爱好者。通过本地运行,用户可获得更快的响应和更高的控制权。

如何使用Ollama在本地运行和自定义大型语言模型(LLMs)

freeCodeCamp.org
freeCodeCamp.org · 2026-03-03T12:00:28Z
有团队将智谱GLM-5从1.65TB压缩到241GB 256GB(内存+显存)即可在本地跑模型

智谱GLM-5模型已从1.65TB压缩至241GB,需256GB内存即可本地运行,支持256GB统一内存的Mac或24GB显存的PC。该模型在编码和聊天方面表现优异,提供更大的上下文窗口。

有团队将智谱GLM-5从1.65TB压缩到241GB 256GB(内存+显存)即可在本地跑模型

蓝点网
蓝点网 · 2026-02-13T05:50:31Z
Clawdbot / OpenClaw 是如何记住一切的

Clawdbot(OpenClaw)是一个开源的个人AI助手,能够在本地运行并处理多种任务。其独特之处在于持久化记忆系统,能够24小时保留上下文并记住对话内容,记忆存储在本地,用户完全掌控。Clawdbot利用Markdown文件进行信息存储和检索,支持多代理记忆隔离,确保个人和工作聊天分开。

Clawdbot / OpenClaw 是如何记住一切的

INTJer
INTJer · 2026-02-01T00:00:00Z
如何在本地运行LLM以与您的文档进行交互

大多数AI工具需要将数据发送到第三方服务器,而本地运行LLM可以保护隐私。本文介绍如何安装Ollama和OpenWebUI,选择合适的模型,设置文档搜索,确保数据不上传云端,从而安全地与敏感文档交互。

如何在本地运行LLM以与您的文档进行交互

freeCodeCamp.org
freeCodeCamp.org · 2026-01-10T00:38:09Z
你错过的七大开源AI编码模型

本文介绍了七种顶级开源编码模型,支持本地运行,确保隐私和控制,避免API费用。这些模型在编码基准测试中表现优异,适合需要保护机密代码的用户。

你错过的七大开源AI编码模型

KDnuggets
KDnuggets · 2025-11-21T13:00:54Z

Foundry Local 是一款可在 Windows 和 Mac 上运行的小型 AI 语言模型工具,类似于本地版 ChatGPT。它支持多种模型格式,用户可通过简单步骤将模型转换为 ONNX 格式并在本地运行。教程详细介绍了安装、转换和运行模型的过程,适合 AI 新手。

技术速递|新手指南:如何在 Foundry Local 中使用自定义模型

dotNET跨平台
dotNET跨平台 · 2025-08-29T23:48:32Z
你所需要的就是Ollama的新应用

Ollama是一款开源应用,允许用户在本地运行大型语言模型,避免依赖云服务。新版本提供友好的图形界面,简化模型下载和使用,支持文件互动和多种数据类型,提升生产力和数据隐私。

你所需要的就是Ollama的新应用

KDnuggets
KDnuggets · 2025-08-14T12:35:51Z

Gemini Robotics On-Device是一个高效的本地机器人模型,具备通用灵活性和快速任务适应能力,能够独立于网络运行,适用于延迟敏感的应用,执行复杂的多步骤指令。开发者可通过SDK进行模型评估和适应,支持快速调整以满足特定需求。该模型在多种测试场景中表现出色,能够完成如折叠衣物等精细任务,推动机器人技术的创新与发展。

Gemini Robotics On-Device将人工智能引入本地机器人设备

Google DeepMind Blog
Google DeepMind Blog · 2025-06-24T14:00:00Z

Gemini Robotics On-Device是一个高效的本地机器人模型,具备通用灵活性和快速任务适应能力。该模型独立于网络运行,适用于延迟敏感的应用,能够执行复杂的多步骤指令。开发者可通过SDK轻松评估和调整模型,以满足特定需求。

Gemini Robotics On-Device 将人工智能引入本地机器人设备

Google DeepMind Blog
Google DeepMind Blog · 2025-06-24T14:00:00Z
使用Ollama和Next.js构建AI助手 - 第1部分

本文介绍了如何使用Next.js、TailwindCSS和Ollama构建本地AI助手,步骤包括创建Next.js项目、安装Ollama并运行Gemma 3:1B模型、连接API和构建聊天界面。该助手在本地运行,确保隐私和快速响应,适合初学者。

使用Ollama和Next.js构建AI助手 - 第1部分

DEV Community
DEV Community · 2025-05-28T23:48:06Z
使用RepoSnap在几秒钟内压缩您的代码库以适应AI

RepoSnap是一款工具,可以在10秒内将50k行代码压缩为适合ChatGPT的文件。它提供可视化选择、即时反馈和单一文件输出,用户只需选择代码库文件夹即可轻松生成快照,支持本地运行,无需网络调用。

使用RepoSnap在几秒钟内压缩您的代码库以适应AI

DEV Community
DEV Community · 2025-04-22T15:45:12Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码