小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
重构大模型通信架构:火山引擎 RocketMQ For AI 解决方案

AIGC技术推动大模型应用,但面临算力成本高和通信调度复杂等挑战。火山引擎推出RocketMQ For AI解决方案,通过轻量化通信和智能调度,提升系统稳定性和算力利用率,支持企业级大模型落地。新特性如LiteTopic和优先级消息优化了消息处理,满足AI场景需求。

重构大模型通信架构:火山引擎 RocketMQ For AI 解决方案

实时互动网
实时互动网 · 2026-05-14T03:37:54Z
红帽的技能包赋予AI代理一种更大模型无法提供的东西:20年的机构记忆

红帽在亚特兰大峰会上推出新的AI技能库,旨在提升企业效率和客户价值。通过结合生成式AI与其平台,红帽希望将AI助手转变为能够执行复杂任务的企业超级用户。新技能包将帮助AI代理更好地理解和使用红帽的工具,确保技术和合同合规。红帽强调,AI不会取代系统管理员的工作,而是改变他们的工作方式,未来的DevOps将更加依赖AI。

红帽的技能包赋予AI代理一种更大模型无法提供的东西:20年的机构记忆

The New Stack
The New Stack · 2026-05-13T15:27:37Z
爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型

爱思唯尔等学术出版商起诉Meta,指控其未经授权使用受版权保护的科研论文训练Llama大模型。诉状称Meta主要依赖Common Crawl数据集及盗版平台LibGen和Sci-Hub。Meta回应将积极应诉,并主张“合理使用”原则。这是学术出版商首次集体对AI企业提起诉讼,未来发展引人关注。

爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型

量子位
量子位 · 2026-05-13T03:10:53Z
2026深度评测:DeepSeek V4 vs ChatGPT 5.5 大模型选型全指南

2026年,DeepSeek V4与ChatGPT 5.5在大模型领域竞争激烈。DeepSeek V4具备1M令牌上下文窗口,适合长文本处理,性价比高;而ChatGPT 5.5在逻辑推理和低幻觉率方面表现优异。选择时需考虑业务需求,DeepSeek适合开源和私有化部署,ChatGPT适合高端生产力和合规性任务。

2026深度评测:DeepSeek V4 vs ChatGPT 5.5 大模型选型全指南

极客技术博客’s Blog
极客技术博客’s Blog · 2026-05-12T21:41:35Z

本文介绍了如何在Windows上本地部署大模型Ollama和OpenWebUI,用户可以在本地运行Llama 3等模型,确保数据隐私、零成本推理和离线使用。文章详细说明了安装步骤、硬件要求和模型推荐,以实现一个私密的AI对话环境。

Windows本地部署大模型 Ollama + OpenWebUI 最佳实践指南

孙威的阳光海
孙威的阳光海 · 2026-05-12T03:40:36Z
在24GB M4 MacBook上跑本地大模型:Qwen 3.5-9B实测40 tokens/s,支持工具调用

开发者jola分享了在M4 MacBook Pro上运行Qwen 3.5-9B(Q4_K_S量化版)本地大语言模型的经验,尽管该模型无法完成复杂任务,但它提升了开发者的参与度,成为一种可控的离线助手,适合24GB内存的用户。

在24GB M4 MacBook上跑本地大模型:Qwen 3.5-9B实测40 tokens/s,支持工具调用

dotNET跨平台
dotNET跨平台 · 2026-05-12T00:01:01Z
具身大模型R1时刻:LIBERO终结者,99.9%背后的物理推理新范式

LaST-R1是一种新型机器人强化学习框架,通过隐空间中的物理推理优化机器人的思考和动作。该方法结合LAPO算法,使机器人在执行动作前进行推理,从而提高在复杂环境中的适应能力和成功率。实验结果显示,LaST-R1在仿真和实际任务中均表现优异,成功率显著提升,标志着机器人从“模仿”向“理解”迈进。

具身大模型R1时刻:LIBERO终结者,99.9%背后的物理推理新范式

量子位
量子位 · 2026-05-11T01:51:36Z
告别云端大模型:本地模型才是应用软件的靠谱未来 |

文章批判开发者过度依赖云端AI,强调本地模型在应用中的重要性。通过新闻应用示例,展示如何利用苹果设备的内置模型实现快速、安全的文本摘要,避免隐私泄露和网络依赖。强调本地处理高效且减少复杂性,建议开发者在适当情况下使用云端模型,以保护用户数据安全。

告别云端大模型:本地模型才是应用软件的靠谱未来 |

极道
极道 · 2026-05-11T00:53:00Z
最新编程跑分 ProgramBench,大模型全军覆没,AI编程真正可怕在哪?

最新的AI编程测试ProgramBench显示,当前大模型在完成完整软件工程项目上表现不佳,结果为0%。这一测试明确了未来AI编程的目标,AI将朝着从零开始重建软件的方向发展。程序员的工作暂时保住,但未来需要转型为需求定义者和质量负责人。AI生成的代码可能不再符合人类可读性,未来编程将面临新的挑战。

最新编程跑分 ProgramBench,大模型全军覆没,AI编程真正可怕在哪?

硕鼠的博客站
硕鼠的博客站 · 2026-05-10T00:51:38Z
Redis之父antirez发布DeepSeek V4 Flash专用推理引擎,128GB MacBook本地跑284B参数大模型

意大利程序员Salvatore Sanfilippo(antirez)发布了新开源项目ds4.c,专为DeepSeek V4 Flash设计的推理引擎。该项目利用Metal GPU,支持高达100万Token的上下文窗口,推理速度极快,适合长文档处理。ds4.c提供CLI和服务器模式,支持本地HTTP服务和磁盘KV缓存,提升了Agent客户端的使用体验。

Redis之父antirez发布DeepSeek V4 Flash专用推理引擎,128GB MacBook本地跑284B参数大模型

dotNET跨平台
dotNET跨平台 · 2026-05-10T00:01:48Z
DeepSeek V4 Flash专用推理引擎ds4.c完全指南:本地跑大模型的新玩法

本文介绍了ds4.c,一个为DeepSeek V4 Flash模型设计的轻量级推理引擎。该引擎支持本地运行,具备超长上下文和高效的KV缓存,能够快速处理复杂问题。与云端API相比,本地运行更安全、无延迟且无额外费用,适合对隐私和性能有高要求的用户。尽管目前仍处于alpha版本,作者欢迎用户测试和反馈。

DeepSeek V4 Flash专用推理引擎ds4.c完全指南:本地跑大模型的新玩法

极道
极道 · 2026-05-07T22:48:00Z
奔赴星河的小美好 | 飞航文创×文心大模型 :让“大国重器”温暖你的生活

中国航天自1956年导弹火箭研究机构成立以来,历经70年,取得了辉煌成就,包括2021年“天宫”空间站的建设。文心大模型与飞航文创合作,推出航天主题文创产品,鼓励公众参与设计与投票,推动航天文化传播与发展。

奔赴星河的小美好 | 飞航文创×文心大模型 :让“大国重器”温暖你的生活

百度大脑
百度大脑 · 2026-05-07T11:14:51Z

【TechWeb】5月7日消息, 2026年5月7日凌晨,马斯克投下了一枚重磅炸弹:他于2023年一手创立的大模型企业xAI将被正式解散。...

大模型打不赢,马斯克换条思路做AI了?

TechWeb 全站精华
TechWeb 全站精华 · 2026-05-07T08:24:33Z
云知声山海知医慧保大模型重磅发布:以高密智能深耕高价值场景,重构医疗保险数智新生态

云知声发布了山海知医慧保大模型,旨在推动医疗保障体系的数智化。该模型结合亿级临床数据,提升医保监管与商保风控能力,实现高效合规审核。通过智能解析病历和医疗单据,显著提高了医保政策问答、编码对齐和业务处理能力,助力行业高质量发展。未来,云知声将继续优化技术,推动医疗保障的智能化转型。

云知声山海知医慧保大模型重磅发布:以高密智能深耕高价值场景,重构医疗保险数智新生态

量子位
量子位 · 2026-05-07T06:35:28Z
AI“翻译”养殖经验智慧养猪提质增效 ——讯飞和光科技用大模型为传统产业升级注入新动能

人工智能正在通过数字技术改造传统养殖业。在吉林长岭的养殖基地,讯飞和光科技利用AI技术将养殖经验转化为智能算法,解决规模化养殖中的效率和成本问题。该项目实现了健康监测、环境调控和饲喂管理的智能化,显著提升了养殖效率和生物安全,为产业智能化提供了可复制的路径,推动了农业的数字化和智能化发展。

AI“翻译”养殖经验智慧养猪提质增效 ——讯飞和光科技用大模型为传统产业升级注入新动能

量子位
量子位 · 2026-05-06T04:32:09Z
团队准备解散了。。

今年,传统开发者面临转型压力,因大模型技术迅速崛起。企业需掌握大模型应用开发,提升技能以适应市场需求。课程提供实战训练,帮助学员掌握核心技术,提升就业竞争力。

团队准备解散了。。

dotNET跨平台
dotNET跨平台 · 2026-05-06T00:01:13Z
使用xiaomi mimo大模型api运行Hermes Agent

Hermes Agent是一款高效智能的AI代理,支持多种模型和微信通道。用户可通过小米的mimo模型申请token,与Hermes进行交互。与OpenClaw相比,Hermes更适合开发者和研究者,提供丰富的内置技能和灵活的API切换。两者均为优秀的开源个人AI代理,满足不同用户需求。

使用xiaomi mimo大模型api运行Hermes Agent

Nicksxs's Blog
Nicksxs's Blog · 2026-05-03T13:28:56Z
大模型能力已经趋同:智能体agent外壳设计成企业竞争新战场

随着大模型能力的趋同,企业竞争的焦点转向智能体外壳设计。外壳决定了AI的执行力,成为新的竞争战场。企业需要定制外壳以提升流程设计和执行效率,未来成功的关键在于外壳的优化,而非模型的智能。

大模型能力已经趋同:智能体agent外壳设计成企业竞争新战场

极道
极道 · 2026-05-03T09:24:00Z
卡帕西揭秘软件3.0:安装软件只需给AI下命令

卡帕西提出软件3.0概念,强调通过大模型简化软件开发,用户只需输入需求即可自动生成结果。传统的中间步骤和模块逐渐被淘汰,未来产品将由传感器、执行器和逻辑三部分构成,分别用传统代码、神经网络和大模型实现。工程师需掌握这三种方法,以确保系统的安全和高效。

卡帕西揭秘软件3.0:安装软件只需给AI下命令

极道
极道 · 2026-05-03T03:17:00Z
OpenAI悄悄丢出隐私小模型:这套流程让大模型彻底看不见你的秘密

OpenAI推出了名为privacy-filter的小模型,通过先处理隐私数据再交给大模型,确保数据安全。该系统可在本地运行,成本低且高效,适用于医疗、金融等敏感行业,提升了AI应用的安全性和可审计性。

OpenAI悄悄丢出隐私小模型:这套流程让大模型彻底看不见你的秘密

极道
极道 · 2026-05-02T22:56:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码