小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude

UniScientist是一个开源的30B参数AI模型,能够实现科研闭环,包括提出假设、收集证据和验证。通过动态系统建模和人类专家的验证,该模型提升了科研效率,超越了许多大型闭源模型,旨在将科研问题转化为可验证的单元测试,推动科学发现。

科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude

量子位
量子位 · 2026-03-09T04:11:54Z
OpenClaw创始人建议用户不要使用小模型跑高风险任务 因为提示词注入防护非常弱

OpenClaw创始人建议用户避免在高风险任务中使用小模型或旧模型,因为这些模型的提示词注入防护较弱,存在安全隐患。用户应选择最新、指令对齐更强的模型,并优化权限设置以提升安全性。

OpenClaw创始人建议用户不要使用小模型跑高风险任务 因为提示词注入防护非常弱

蓝点网
蓝点网 · 2026-03-07T04:11:04Z
林俊旸离开的48小时:一条朋友圈、一个小模型、和一个万亿美金的假设

Qwen团队发布的小模型Qwen 3.5 Small在多项测试中表现优于大模型,展现了小模型的潜力。然而,阿里巴巴的云计算商业模式与小模型相悖,导致团队面临困境。林俊旸的离职反映了这一结构性矛盾。

林俊旸离开的48小时:一条朋友圈、一个小模型、和一个万亿美金的假设

爱范儿
爱范儿 · 2026-03-05T11:47:11Z
[实验性] 有开发者破解苹果ANE神经网络引擎 原来M4芯片也能直接训练小模型

开发者通过逆向工程破解了苹果的ANE神经网络引擎,使其能够在M4芯片上训练小型AI模型。尽管目前只能训练极小规模的模型,但未来个人设备可能实现自我学习,减少对云端的依赖。

[实验性] 有开发者破解苹果ANE神经网络引擎 原来M4芯片也能直接训练小模型

蓝点网
蓝点网 · 2026-03-04T00:30:28Z
ELM 架构突破:Modulate 用 100+ 个小模型打败 LLM,开启语音 AI 新时代

Modulate的ELM架构通过100多个小模型实现语音AI的突破,保留多维信息,提高准确率和成本效率。该技术广泛应用于游戏、客服和金融等领域,标志着AI从单一巨头向智能协作转变。

ELM 架构突破:Modulate 用 100+ 个小模型打败 LLM,开启语音 AI 新时代

Micropaper
Micropaper · 2026-03-02T09:30:00Z

ICLR 2026 | 7B小模型干翻GPT-5?AdaResoner实现Agentic Vision的主动「视觉工具思考」

机器之心
机器之心 · 2026-02-15T11:06:06Z

Loop-ViT:让AI学会「反复思考」,3.8M参数小模型追平人类平均水平

机器之心
机器之心 · 2026-02-12T12:15:07Z

蚂蚁推出AlignXplore+,通过文本化用户建模实现个性化,突破传统推荐系统的局限。该模型具备全域通用、极致迁移和实战适配三大特性,能够有效理解用户偏好,提升个性化应用的准确性和鲁棒性。

蚂蚁用8B小模型构建用户“话”像,跨任务跨模型通用且SOTA

量子位
量子位 · 2026-01-31T12:36:45Z

DeepSeek发布了新OCR模型DeepSeek-OCR 2,采用轻量化Qwen2-0.5B模型,性能接近Gemini-3 Pro。该模型通过DeepEncoder V2实现视觉标记智能重排,提升PDF转Markdown的准确性,基于OmniDocBench v1.5测试显示性能提升3.73%。

DeepSeek开源全新OCR模型!弃用CLIP改用Qwen轻量小模型,性能媲美Gemini-3 Pro

量子位
量子位 · 2026-01-28T06:16:01Z

中兴Nebula小模型为手机提供AI助手功能,支持“一句话点餐”等操作,准确率超过90%。该技术通过自研数据系统提升数据质量,未来将扩展至更多APP,推动手机智能化发展。

聚焦手机AI“超级入口”,中兴Nebula小模型让手机秒变“小秘”?

量子位
量子位 · 2025-11-04T06:36:07Z

Thinking Machine的新研究提出了一种名为在线策略蒸馏的方法,结合强化学习与微调,显著提高小模型的训练效率,减少训练步骤50-100倍,适合资源有限的个人和小公司。同时,该方法有效解决了AI的“灾难性遗忘”问题,支持模型的终身学习。

Thinking Machine新研究刷屏!结合RL+微调,小模型训练更具性价比

量子位
量子位 · 2025-10-28T01:32:17Z

斯坦福团队的AgentFlow系统通过在线强化学习优化智能体,显著提升推理能力,超越GPT-4o等大型模型。该系统由四个专业智能体协作,实时优化决策,尤其在知识检索和智能体任务中提升超过14%,展示了模块化设计和动态学习的重要性。

AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o

量子位
量子位 · 2025-10-24T04:16:56Z

港科大 X MiniMax:高质量数据、小模型挑战复杂网络搜索难题

机器之心
机器之心 · 2025-09-12T08:54:19Z

NVIDIA推出了轻量级大语言模型Nemotron-Nano-9B-v2,结合Mamba和Transformer技术,支持128K超长上下文,推理能力强,适合小型设备。该模型在准确率和吞吐量上优于同规模的开源模型,标志着轻量化部署的突破。

在线教程丨英伟达力推小模型,小而精的Nemotron-Nano-9B-v2比Qwen3快6倍

HyperAI超神经
HyperAI超神经 · 2025-08-29T03:35:54Z

英伟达推出了新型小型语言模型Nemotron Nano v2,参数为90亿,速度比Qwen3快6倍,准确率相当。该模型在20万亿token上预训练,并开源大部分数据集,支持复杂推理和思考预算控制。

英伟达开源9B参数小模型,比Qwen3快6倍

量子位
量子位 · 2025-08-19T06:46:12Z

英伟达研究显示,小模型在Agent任务中更具经济性和灵活性,能够有效替代大模型。通过优化硬件资源和任务设计,小模型降低了计算成本,适合本地部署。尽管面临基础设施适配和市场认知度低的挑战,小模型在特定任务中展现出良好潜力。

英伟达新研究:小模型才是智能体的未来

量子位
量子位 · 2025-08-19T00:13:05Z

王冠开发的27M小模型HRM采用仿脑设计,克服了Transformer的局限性。通过分层循环模块和近似梯度技术,HRM实现了高效推理,准确率超过大型模型。尽管参数较少,HRM在特定任务中表现优异,展现出新架构的潜力。

又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

量子位
量子位 · 2025-08-10T05:34:26Z

手机也能跑,腾讯混元一口气开源4款小模型

机器之心
机器之心 · 2025-08-04T12:15:41Z

香港大学、字节跳动Seed和复旦大学联合推出的Polaris方法,通过700步强化学习训练,使4B模型在数学推理能力上超越多款商业大模型,特别是在长文本生成方面表现突出。该方法强调动态调整训练数据和超参数,提升了模型的多样性和准确性。

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

量子位
量子位 · 2025-07-09T06:58:32Z

本文探讨了NVIDIA的小模型(SLM)在AI代理中的未来,认为SLM在性能、经济性和适应性方面优于大模型(LLM),能够高效处理特定任务,降低成本并提高灵活性。未来AI架构将从“大模型单体”转向“小模型微服务”,实现更高效的系统设计。

NVIDIA 的颠覆性观点:AI Agent 的未来,属于小模型 (SLM)

Tony Bai
Tony Bai · 2025-07-04T14:02:13Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码