多模态技术的前沿探索：从实时数字人到强化推理新范式 - 小红花·文摘 - 小红花技术领袖俱乐部

Kimi K3在Arena编码排行榜上名列前茅——并且是开源模型

Kimi K3在Arena编码排行榜上名列前茅——并且是开源模型

The New Stack ·

$ABot-AgentOS——具备多模态记忆的通用智能体操作系统：Agent Harness层(含上下文管理和验证系统)、LLM、记忆作为大脑，自主调用下层导航、操作、运控相关的技能$

ABot-AgentOS——具备多模态记忆的通用智能体操作系统：Agent Harness层(含上下文管理和验证系统)、LLM、记忆作为大脑，自主调用下层导航、操作、运控相关的技能

结构之法算法之道 ·

OpenAI前CTO发布开源模型Inkling：可低成本微调的六边形战士

OpenAI前CTO发布开源模型Inkling：可低成本微调的六边形战士

极道 ·

刚刚，一个免费AI Coding选手杀入全球第一梯队

刚刚，一个免费AI Coding选手杀入全球第一梯队

量子位 ·

OCR 教程汇总丨覆盖长文档/端到端/多语言，百度/小红书/华中科大等面向不同场景开源高性能模型，实现多模态文档精准解析

OCR 教程汇总丨覆盖长文档/端到端/多语言，百度/小红书/华中科大等面向不同场景开源高性能模型，实现多模态文档精准解析

HyperAI超神经 ·

字节跳动发布多模态图像创作模型Seedream 5.0 Pro 生图更懂设计

字节跳动发布多模态图像创作模型Seedream 5.0 Pro 生图更懂设计

TechWeb 全站精华 ·

让Skill“有图可依”：openJiuwen首发多模态Skill范式Skill-Omni

量子位 ·

科大讯飞举办智能交互生态发布会，三大平台同步升级

量子位 ·

OceanBase湖库一体，重新定义AI数据库

量子位 ·

24小时直播，只靠一张照片？虎牙实时多模态数字人VAM 1.0率先突围行业三堵墙

量子位 ·

MiMo Auto 免费 API 使用指南：从 MiMo Code 中提取免费的 MiMo Auto 模型

MiMo Auto 免费 API 使用指南：从 MiMo Code 中提取免费的 MiMo Auto 模型

小众软件 ·

MiniMax M3在AI Gateway上

MiniMax M3在AI Gateway上

Vercel News ·

将DSA注意力引入多模态，快手Keye2.0开启强化推理新范式

量子位 ·

被市场低估的，不止Google ？

被市场低估的，不止Google ？

TechWeb 全站精华 ·

BalCapRL：一种基于强化学习的多模态大语言模型图像描述的平衡框架

BalCapRL：一种基于强化学习的多模态大语言模型图像描述的平衡框架

Apple Machine Learning Research ·

谷歌扩展了Gemini API的文件搜索工具，支持多模态数据和自定义元数据，提升了检索增强生成系统的能力。新功能包括图像与文本的联合处理和页面引用，帮助用户更准确地找到信息并验证来源，使应用程序在处理大量数据时更高效、可靠。

Gemini API 文件搜索现已支持多模态：构建高效、可验证的检索增强生成系统

The Keyword ·

graphify-dotnet 是一款专注于代码分析的多模态知识图谱构建工具。它通过多阶段流水线处理文件，提取概念与关系，构建知识图谱，帮助开发者更好地理解项目架构，并为 AI 编程助手提供结构化上下文，从而提升代码生成的质量与可靠性。

Graphify-DotNet：AI 驱动的 .NET 代码知识图谱构建工具

dotNET跨平台 ·

小米正式开源 MiMo 系列模型，顺手送100万亿Token

小米正式开源 MiMo 系列模型，顺手送100万亿Token

dotNET跨平台 ·

打工人五一自救指南：把活全甩给AI，准备免打扰出门

量子位 ·

【效果逆天】零样本工业缺陷改变工业质检，颠覆YOLO系列模型效果

【效果逆天】零样本工业缺陷改变工业质检，颠覆YOLO系列模型效果

gloomyfish ·