小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
教程汇总丨开源小模型综合智能水平追平GPT-5,一站测评Qwen 3.5/Gemma 4等热门模型

第三方评测机构Artificial Analysis发布报告称,Qwen3.5 27B和Gemma 4 31B在智能水平上接近GPT-5。Qwen3.5在推理能力上表现优异,但知识准确性仍有不足。两款模型支持多模态输入,适合本地部署,降低使用门槛。Gemma 4系列在多种应用场景中表现出色,具备强大的推理和语言处理能力。

教程汇总丨开源小模型综合智能水平追平GPT-5,一站测评Qwen 3.5/Gemma 4等热门模型

HyperAI超神经
HyperAI超神经 · 2026-04-17T05:04:36Z
小模型也发现了Mythos发现的漏洞:系统比模型更重要,能力呈锯齿状!

AI安全能力已具实用性,小模型能够完成关键任务,能力呈现锯齿状波动。真正的竞争在于系统设计和流程编排,而非单一模型性能。行业应尽快落地实践,避免继续观望。

小模型也发现了Mythos发现的漏洞:系统比模型更重要,能力呈锯齿状!

极道
极道 · 2026-04-12T06:28:00Z
以小小小小胜大!Google 最强小模型刚刚发布,手机也能跑

Google发布的Gemma 4系列模型全面开源,遵循Apache 2.0协议,允许开发者自由使用和修改。新模型性能显著提升,支持在手机和边缘设备上离线运行,满足数据主权需求,推动AI在医疗和金融等行业的应用。

以小小小小胜大!Google 最强小模型刚刚发布,手机也能跑

爱范儿
爱范儿 · 2026-04-03T01:00:40Z
单张显卡跑出15倍推理速度,aiX-apply-4B小模型加速企业AI研发落地

硅心科技推出的aiX-apply-4B模型在代码变更应用中表现优异,准确率达到93.8%,推理速度提升15倍,且仅需一张显卡即可高效运行,解决了企业算力不足的问题。

单张显卡跑出15倍推理速度,aiX-apply-4B小模型加速企业AI研发落地

量子位
量子位 · 2026-03-30T00:41:45Z
医疗 AI:小公司的机会可能比你想的大

OpenEvidence 日均进行 100 万次临床咨询,覆盖超过 1 万家医院,40% 的美国医生在使用。医疗 AI 市场快速增长,预计中国市场将从 88 亿增长至 3157 亿人民币。小模型在医疗领域可能更具优势,强调场景理解和流程设计的重要性。

医疗 AI:小公司的机会可能比你想的大

凡人小北 · 转角处
凡人小北 · 转角处 · 2026-03-22T00:00:00Z
医疗 AI:小公司的机会可能比你想的大

OpenEvidence 日均进行 100 万次临床咨询,覆盖超过 1 万家医院,40% 的美国医生在使用。医疗 AI 市场快速增长,预计中国市场将从 88 亿人民币增至 3157 亿人民币。小模型在医疗领域可能更具优势,强调场景理解和流程设计的重要性。

医疗 AI:小公司的机会可能比你想的大

凡人小北 · 转角处
凡人小北 · 转角处 · 2026-03-22T00:00:00Z
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude

UniScientist是一个开源的30B参数AI模型,能够实现科研闭环,包括提出假设、收集证据和验证。通过动态系统建模和人类专家的验证,该模型提升了科研效率,超越了许多大型闭源模型,旨在将科研问题转化为可验证的单元测试,推动科学发现。

科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude

量子位
量子位 · 2026-03-09T04:11:54Z
OpenClaw创始人建议用户不要使用小模型跑高风险任务 因为提示词注入防护非常弱

OpenClaw创始人建议用户避免在高风险任务中使用小模型或旧模型,因为这些模型的提示词注入防护较弱,存在安全隐患。用户应选择最新、指令对齐更强的模型,并优化权限设置以提升安全性。

OpenClaw创始人建议用户不要使用小模型跑高风险任务 因为提示词注入防护非常弱

蓝点网
蓝点网 · 2026-03-07T04:11:04Z
林俊旸离开的48小时:一条朋友圈、一个小模型、和一个万亿美金的假设

Qwen团队发布的小模型Qwen 3.5 Small在多项测试中表现优于大模型,展现了小模型的潜力。然而,阿里巴巴的云计算商业模式与小模型相悖,导致团队面临困境。林俊旸的离职反映了这一结构性矛盾。

林俊旸离开的48小时:一条朋友圈、一个小模型、和一个万亿美金的假设

爱范儿
爱范儿 · 2026-03-05T11:47:11Z
[实验性] 有开发者破解苹果ANE神经网络引擎 原来M4芯片也能直接训练小模型

开发者通过逆向工程破解了苹果的ANE神经网络引擎,使其能够在M4芯片上训练小型AI模型。尽管目前只能训练极小规模的模型,但未来个人设备可能实现自我学习,减少对云端的依赖。

[实验性] 有开发者破解苹果ANE神经网络引擎 原来M4芯片也能直接训练小模型

蓝点网
蓝点网 · 2026-03-04T00:30:28Z
ELM 架构突破:Modulate 用 100+ 个小模型打败 LLM,开启语音 AI 新时代

Modulate的ELM架构通过100多个小模型实现语音AI的突破,保留多维信息,提高准确率和成本效率。该技术广泛应用于游戏、客服和金融等领域,标志着AI从单一巨头向智能协作转变。

ELM 架构突破:Modulate 用 100+ 个小模型打败 LLM,开启语音 AI 新时代

Micropaper
Micropaper · 2026-03-02T09:30:00Z
Ferret-UI Lite:构建小型设备端图形用户界面代理的经验教训

Ferret-UI Lite是一个适用于移动、网页和桌面的紧凑型端到端图形用户界面(GUI)代理。通过优化小模型的技术,该代理在多个基准测试中表现优异,GUI定位得分为91.6%、53.3%和61.2%,而在GUI导航方面的成功率为28.0%和19.8%。本文分享了在紧凑型设备上开发GUI代理的方法和经验。

Ferret-UI Lite:构建小型设备端图形用户界面代理的经验教训

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-17T00:00:00Z
ICLR 2026 | 7B小模型干翻GPT-5?AdaResoner实现Agentic Vision的主动「视觉工具思考」

抱歉,您提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。

ICLR 2026 | 7B小模型干翻GPT-5?AdaResoner实现Agentic Vision的主动「视觉工具思考」

机器之心
机器之心 · 2026-02-15T11:06:06Z
Loop-ViT:让AI学会「反复思考」,3.8M参数小模型追平人类平均水平

抱歉,您提供的文本内容过于简短,无法进行有效的总结。请提供更详细的文章内容。

Loop-ViT:让AI学会「反复思考」,3.8M参数小模型追平人类平均水平

机器之心
机器之心 · 2026-02-12T12:15:07Z

蚂蚁推出AlignXplore+,通过文本化用户建模实现个性化,突破传统推荐系统的局限。该模型具备全域通用、极致迁移和实战适配三大特性,能够有效理解用户偏好,提升个性化应用的准确性和鲁棒性。

蚂蚁用8B小模型构建用户“话”像,跨任务跨模型通用且SOTA

量子位
量子位 · 2026-01-31T12:36:45Z

DeepSeek发布了新OCR模型DeepSeek-OCR 2,采用轻量化Qwen2-0.5B模型,性能接近Gemini-3 Pro。该模型通过DeepEncoder V2实现视觉标记智能重排,提升PDF转Markdown的准确性,基于OmniDocBench v1.5测试显示性能提升3.73%。

DeepSeek开源全新OCR模型!弃用CLIP改用Qwen轻量小模型,性能媲美Gemini-3 Pro

量子位
量子位 · 2026-01-28T06:16:01Z

中兴Nebula小模型为手机提供AI助手功能,支持“一句话点餐”等操作,准确率超过90%。该技术通过自研数据系统提升数据质量,未来将扩展至更多APP,推动手机智能化发展。

聚焦手机AI“超级入口”,中兴Nebula小模型让手机秒变“小秘”?

量子位
量子位 · 2025-11-04T06:36:07Z

Thinking Machine的新研究提出了一种名为在线策略蒸馏的方法,结合强化学习与微调,显著提高小模型的训练效率,减少训练步骤50-100倍,适合资源有限的个人和小公司。同时,该方法有效解决了AI的“灾难性遗忘”问题,支持模型的终身学习。

Thinking Machine新研究刷屏!结合RL+微调,小模型训练更具性价比

量子位
量子位 · 2025-10-28T01:32:17Z

斯坦福团队的AgentFlow系统通过在线强化学习优化智能体,显著提升推理能力,超越GPT-4o等大型模型。该系统由四个专业智能体协作,实时优化决策,尤其在知识检索和智能体任务中提升超过14%,展示了模块化设计和动态学习的重要性。

AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o

量子位
量子位 · 2025-10-24T04:16:56Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。

港科大 X MiniMax:高质量数据、小模型挑战复杂网络搜索难题

机器之心
机器之心 · 2025-09-12T08:54:19Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码