小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
软通动力宣布“北京壹号词元工厂”正式投入运行

软通动力于6月11日宣布“北京壹号词元工厂”正式投入运行,标志着大模型算力进入标准化时代。该工厂专注于智能体服务,优化硬件性能和算法,提供高性价比的“数字燃料”——Token,并发布了开源的词元工厂性能基准,构建了完整的评测体系。软通动力还参与多个国家重点项目,推动全球AI合作。

软通动力宣布“北京壹号词元工厂”正式投入运行

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-11T06:13:00Z
实测小米最快1T大模型:吞吐量每秒1000+ Tokens,Vibe Coding七秒交付

小米推出了MiMo-V2.5-Pro-UltraSpeed模型,具备1T参数和1000+ TPS的推理速度,突破了GPU的性能限制。该模型在全栈开发任务中表现优异,能够快速生成高质量的复杂应用,推动了大模型的商业化进程。

实测小米最快1T大模型:吞吐量每秒1000+ Tokens,Vibe Coding七秒交付

量子位
量子位 · 2026-06-11T01:18:16Z
摩尔线程MusaCoder开源:首个基于国产全功能GPU全栈训练的代码大模型,性能比肩国际SOTA

摩尔线程发布了开源大模型MusaCoder,专为GPU底层算子生成设计,支持从PyTorch自动生成高性能CUDA/MUSA代码,提升开发效率。MusaCoder在KernelBench评测中表现优异,超越多款主流模型。其全链路训练依托国产MTT S5000集群,验证了国产GPU的强大能力,推动GPU编程和AI技术的创新与应用。

摩尔线程MusaCoder开源:首个基于国产全功能GPU全栈训练的代码大模型,性能比肩国际SOTA

实时互动网
实时互动网 · 2026-06-10T09:59:05Z
各家AI大模型API平台推荐与简介,2026.6.13更新

到2026年,AI模型生态将变得复杂,API聚合平台将成为主流解决方案。推荐多个国内外平台,如硅基流动、星图和阿里云百炼,帮助开发者以低成本调用数百个模型,简化API对接和管理。这些平台提供不同的免费额度和企业级保障,以满足开发者的需求。

各家AI大模型API平台推荐与简介,2026.6.13更新

Zeruns's Blog
Zeruns's Blog · 2026-06-09T17:15:00Z
数颐联康上海老博会首发“南山大模型”

数颐联康在上海国际养老博览会上发布了“南山大模型”,结合多项前沿技术,支持居家、机构和医院的智能服务。同时推出的“灵犀整合照护平台”和“易照护智慧监管平台”有效解决了居家护理的痛点。展会期间,公司还与多家企业签署了战略合作协议,并交付了全球首台养老服务机器人“齐家·小如”。

数颐联康上海老博会首发“南山大模型”

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-09T07:31:22Z
与爱为舞亮相腾讯云AI产业应用大会,深耕教育大模型,打造下一代学习Agent

2026腾讯云AI产业应用大会在北京举行,聚焦AI在教育领域的应用。王琳与爱为舞合作,分享了教育大模型和学习Agent的探索,强调数据驱动教学的智能闭环。大会讨论了AI如何重塑教学逻辑,提升教育质量,推动教育AI的产业落地。

与爱为舞亮相腾讯云AI产业应用大会,深耕教育大模型,打造下一代学习Agent

量子位
量子位 · 2026-06-09T07:11:48Z
国产通用大模型第一梯队,来新人了?!

云知声推出的新一代大模型U2,采用“智能密度×Token价值”理念,旨在降低Token消耗并提升智能效率。U2在多项评测中表现优异,推理成本显著低于同类模型,验证了智能密度的可行性,标志着AI行业竞争格局的转变。

国产通用大模型第一梯队,来新人了?!

量子位
量子位 · 2026-06-09T02:55:08Z

本文探讨了大语言模型在推理阶段的退化现象,如死循环和乱码等问题。退化源于自回归Transformer的注意力机制和数值精度,导致输出失控。文章分析了退化的数学根源、表现形式及其机制,并提出了多层防御策略,包括架构设计、数值工程和解码策略,以提高模型在生产环境中的稳定性。

【Transformer 与注意力机制】59|推理退化:为什么大模型会输出乱码、死循环和无意义文本

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-06-09T00:00:00Z
斑马智能推出行业首个全模态端侧大模型AutoOmni

斑马智能在高通峰会上推出全模态端侧大模型AutoOmni,具备低延迟、高精准和保隐私特性,响应时间小于500毫秒。该模型提升了自然交互度和服务链接成功率。斑马智能与高通合作,已与69家车企合作,落地超1000万辆智能汽车。

斑马智能推出行业首个全模态端侧大模型AutoOmni

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-08T10:20:14Z
大模型看Coding,具身看Picking!原力灵机已抢先入局

原力灵机与Atomix合并,专注于具身智能中的“Picking”任务,通过真实场景生成大量数据,推动模型迭代。此合并将数据与模型整合,形成闭环,助力具身智能行业发展,成为行业转型的关键支点。

大模型看Coding,具身看Picking!原力灵机已抢先入局

量子位
量子位 · 2026-06-08T06:30:23Z
价格差了 20 倍,效果却差得有限:大模型的价格墙正在松动

大模型的价格差异正在缩小,MiniMax M3在代码审计中以$0.07发现13个问题,而Claude Opus 4.8最贵档次花费$3.39仅发现15个问题。测试表明,推理强度与发现问题数量并不总成正比,MiniMax M3在主要安全问题上表现优异,适合预算有限的审计任务。选择模型时应根据具体需求,便宜模型的能力正在快速提升。

价格差了 20 倍,效果却差得有限:大模型的价格墙正在松动

乱世浮生
乱世浮生 · 2026-06-07T16:00:00Z
关于适合什么模型,推荐下llmfit

llmfit软件可以在本地评估计算机性能,以运行大模型。用户通过安装llmfit查看不同模型的参数、速度、内存和硬盘占用,从而判断电脑能运行哪些模型。llmfit识别设备配置,支持多种加速后端,帮助用户优化模型运行。

关于适合什么模型,推荐下llmfit

Nicksxs's Blog
Nicksxs's Blog · 2026-06-07T14:21:03Z
大模型发展三年半,AI圈终于等来了一场“不要大厂,只赌脑洞”的比赛

B站推出的“build in bilibili·AI创造公开赛”鼓励参与者利用AI工具创作,打破技术壁垒。参赛者展示创作过程,观众通过投币决定作品曝光和奖励,形成去中心化评价体系。这场比赛强调普通人的创意和需求,推动AI应用的社区共创,开启全民创造新模式。

大模型发展三年半,AI圈终于等来了一场“不要大厂,只赌脑洞”的比赛

量子位
量子位 · 2026-06-06T07:15:13Z

近期多家科技公司高管频繁变动。华为盘古大模型负责人王云鹤离职创业,成立新公司“基元律动”;阿里副总裁张凯夫也离职创业,专注市场行为预测;苹果硬件部门进行重大重组;微软Xbox任命新首席战略官;OpenAI联合创始人卡帕西加入Anthropic,增强竞争力。

原华为盘古大模型负责人王云鹤离职创业;苹果硬件负责人启动重大重组;OpenAI联合创始人加入Anthropic

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-04T05:31:30Z
LeCun 10亿押注的方向,全球领先视觉大模型团队早已布局

视启未来团队专注于开发隐空间世界模型,推动AI从“看见”向“预见”转变。创始人张磊指出,理解因果关系和物理规律至关重要。团队通过提升物体理解能力,推出全球领先的视觉大模型DINO-X,未来希望将世界模型作为物理世界AI的核心基础设施,助力机器人自主学习和决策。

LeCun 10亿押注的方向,全球领先视觉大模型团队早已布局

量子位
量子位 · 2026-06-04T03:43:37Z
一千台599美元Mac mini替代H100跑大模型:便宜十倍

一千台599美元的Mac mini可以替代昂贵的H100服务器,具有低成本和低功耗的优势。Mac mini的统一内存架构提升了AI模型的运行效率,适合本地部署。相比之下,云服务费用高昂,使用Mac mini搭建AI服务器简单易行,能有效节省成本。

一千台599美元Mac mini替代H100跑大模型:便宜十倍

极道
极道 · 2026-06-03T22:26:00Z
大模型企业扎堆IPO:智谱MiniMax冲刺A股,Anthropic抢先OpenAI递表

2026年6月,全球人工智能市场迎来大模型上市热潮。中国智谱与MiniMax启动A股IPO,美国Anthropic也向SEC提交上市申请。智谱计划募资150亿元用于大模型研发,MiniMax加速上市。尽管两家公司股价表现优异,但均面临巨额亏损,市场竞争激烈,企业急需资金争夺定价权。2026年将成为大模型IPO元年。

大模型企业扎堆IPO:智谱MiniMax冲刺A股,Anthropic抢先OpenAI递表

TechWeb 全站精华
TechWeb 全站精华 · 2026-06-02T13:01:05Z

亚马逊云科技宣布,GPT-5.5、GPT-5.4和Codex已在Amazon Bedrock上线,企业可直接调用这些大模型以支持复杂任务,计费标准与OpenAI一致,无额外费用。Codex可通过多种IDE插件使用,推理计算符合数据合规要求。亚马逊将持续扩展OpenAI的能力。

GPT-5.5、GPT-5.4和Codex已在Amazon Bedrock上正式可用

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-02T06:07:22Z
跑大模型,最贵的不是 GPU,是这个东西

Llama-70B模型在处理128K token请求时,KV Cache占用429GB显存,成为推理成本的主要因素。通过TurboQuant、PD拆分和LMCache等技术,可以将长上下文推理成本降低4到40倍。这些技术的应用将显著提升效率,改善产品体验,推动LLM的广泛使用。

跑大模型,最贵的不是 GPU,是这个东西

迷途小书童
迷途小书童 · 2026-06-01T13:45:20Z

本文记录了在Mac Mini上安装和配置本地大模型工具的过程,重点介绍了如何通过Ollama运行LLM模型,并结合Dify搭建私有知识库,支持网页抓取和文件上传,实现个性化的知识检索和生成。

笔记:在 Mac Mini 本地跑 LLM 大模型

四火的唠叨
四火的唠叨 · 2026-06-01T04:03:31Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码