小红花·文摘

蚂蚁健康与北大王俊院士团队发布全球首个专病循证评测框架GAPS，专注于肺癌，包含92个问题和1691个临床要点，旨在提升医疗AI的评测深度与可靠性。GAPS通过四个维度评估AI的临床能力，克服现有评测的局限，推动医疗AI向临床应用转型。

AI医生终于有了硬标尺！全球首个专病循证评测框架GAPS发布，蚂蚁联合北大王俊院士团队出品

量子位 ·

Learn how to bring life to your database by inserting records into your MySQL tables! This post shows beginners how to use INSERT statements—with lighthearted library metaphors, approachable SQL...

MySQL Basics: Filling the Gaps—Inserting Data into Your Tables

Planet MySQL ·

本研究探讨了人工神经网络在学习和虚构能力方面的不足，特别是在储层计算机中的虚构现象。分析未训练吸引子在重构失败时的作用，认为它们是学习系统的固有特征，可能影响人工智能的信息生成与失真。

Confabulation Dynamics in Reservoir Computers: Filling the Gaps with Untrained Attractors

BriefGPT - AI 论文速递 ·

本研究探讨了大语言模型（LLM）在复杂环境中的局限性，指出仅依赖程序性记忆无法满足实际需求。提出了一种结合语义记忆和联想学习的模块化架构，以增强LLM的适应能力，提升其在恶劣学习环境中的表现。

Procedural Memory Is Not All You Need: Bridging Cognitive Gaps in LLM-Based Agents

BriefGPT - AI 论文速递 ·

本研究探讨了人工智能治理中的现实差距，特别是在高风险领域的关注不足。研究指出，企业在AI部署阶段的研究关注减弱，导致对已部署AI的知识缺陷加深。建议扩大外部研究者对部署数据的访问。

Real-World Gaps in AI Governance Research

BriefGPT - AI 论文速递 ·

本研究分析了中国医学大型语言模型在准确性、安全性和伦理一致性方面的不足，提出了细致的错误分类法，并评估了前10个模型在MedBench上的表现。研究还提出了四级优化策略，以提升医学LLMs的临床应用价值和安全性。

Benchmarking Chinese Medical Large Language Models Based on Medbench: Analysis of Performance Gaps and Hierarchical Optimization Strategies

BriefGPT - AI 论文速递 ·

More productive MSMEs would help North Carolina foster the sustainable and inclusive economy it wants to be. And it would be good for business, too, write David Pralong and Kevin Russell in...