小红花·文摘 - 小红花技术领袖俱乐部

一分钟读论文：《Safety Sentry：上下文感知的三向路由Agent安全审查》

一分钟读论文：《Safety Sentry：上下文感知的三向路由Agent安全审查》

Micropaper ·

阿里斩获国际AI顶会最佳资源论文奖，提出Agent评测新范式

量子位 ·

残余上下文扩散语言模型

残余上下文扩散语言模型

Apple Machine Learning Research ·

模型上新：阿里推出 Fun-ASR-Flash，从“听清楚”走向“听明白”

模型上新：阿里推出 Fun-ASR-Flash，从“听清楚”走向“听明白”

实时互动网 ·

AI 范式雷达：《Agent规划脆弱性——检索受限下大规模工具生态中的长期规划基准测试》

AI 范式雷达：《Agent规划脆弱性——检索受限下大规模工具生态中的长期规划基准测试》

Micropaper ·

微调6亿参数Qwen3 4B实现91.6%分类准确率

微调6亿参数Qwen3 4B实现91.6%分类准确率

极道 ·

一分钟读论文：《重新思考还是延长预算？面向推理预算的选择性验证》

一分钟读论文：《重新思考还是延长预算？面向推理预算的选择性验证》

Micropaper ·

【公益译文】2026年AI指数报告（四）

【公益译文】2026年AI指数报告（四）

绿盟科技技术博客 ·

如何提升AI实时语音技术准确率？

如何提升AI实时语音技术准确率？

实时互动网 ·

论文周报 |微软MAI-Thinking探索纯RL自我进化，AIME准确率达97%；无需架构修改，VLM³凭纯文本坐标实现3D任务泛化...速览一周AI前沿论文

论文周报 |微软MAI-Thinking探索纯RL自我进化，AIME准确率达97%；无需架构修改，VLM³凭纯文本坐标实现3D任务泛化...速览一周AI前沿论文

HyperAI超神经 ·

深度估计准确率冲上0.9，Meta提出VLM³，论证视觉模型天生会学3D，以Qwen3-VL-4B为基础实现多任务的统一建模

深度估计准确率冲上0.9，Meta提出VLM³，论证视觉模型天生会学3D，以Qwen3-VL-4B为基础实现多任务的统一建模

HyperAI超神经 ·

分析：AI 助手在回答流媒体可用性查询方面表现不一致

分析：AI 助手在回答流媒体可用性查询方面表现不一致

实时互动网 ·

百度文心发布 PaddleOCR-VL-1.6：准确率突破 96.33%，刷新文档解析 SOTA

量子位 ·

大模型不适用于临床管理：对真实世界电子健康记录中结构化查询的评估

大模型不适用于临床管理：对真实世界电子健康记录中结构化查询的评估

极道 ·

Databricks将GPT-5.5引入企业代理工作流

Databricks将GPT-5.5引入企业代理工作流

OpenAI ·

2023年，大语言模型推动Text-to-SQL技术显著进展，准确率从50%提升至85%以上。文章探讨了DIN-SQL、C3和DAIL-SQL三种方法，强调schema linking、SQL生成和自我校验的重要性。Text-to-SQL不仅是NLP问题，也是数据库接入层的挑战，未来系统将更注重模块化和可复用性。

【数据库研究前沿】Text-to-SQL 与 Agentic Query：DIN-SQL、C3、DAIL-SQL 工程复盘

土法炼钢兴趣小组的博客 ·

熊猫发现Withings Sleep睡眠监测垫，解决了传统穿戴设备的不便。该垫通过气动传感器监测睡眠，准确率达94.4%，使用简单，无需佩戴和充电，提供全面的睡眠数据，帮助改善睡眠质量。

告别手腕上的束缚！这款这无感监测垫让我实现“裸睡级”睡眠追踪

熊猫不是猫QAQ ·

单张显卡跑出15倍推理速度，aiX-apply-4B小模型加速企业AI研发落地

量子位 ·

溶血性预测准确率提升350%，港中文/浙大/澳门理工等团队提出通用框架Bi-TEAM，融合生物学语义与化学精度

溶血性预测准确率提升350%，港中文/浙大/澳门理工等团队提出通用框架Bi-TEAM，融合生物学语义与化学精度

HyperAI超神经 ·

春节期间，我尝试了多款语音输入软件，使用“闪电说”结合流式模型进行转写。尽管输入效率明显提升，但准确率和环境噪音仍是问题，AI的过度加工也影响体验。尽管如此，语音输入在特定情况下仍能提高效率，未来我将继续探索这一工作流。

从打字到动嘴：我的语音输入踩坑与探索

YeungYeah 的乱写地 ·