BriefGPT - AI 论文速递 ·

Pediatric Benchmark: A Comprehensive Chinese Pediatric Dataset for Benchmarking Large Language Models

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本研究构建了首个中文儿科数据集PediaBench，包含4625个客观问题和1632个主观问题，涵盖12种儿科疾病。实验结果表明，LLMs在中文儿科问题处理上存在局限性，提示未来改进方向。

🎯

🏷️

.NET 10 File-Based Apps：一个 .cs 文件搞定一切，C# 终于也能像 Python 一样写脚本了！ - 张善友
.NET 10 引入了一个重磅新特性——File-Based Apps（文件级应用）。它允许你仅用一个 .cs 文件，无需任何 .csproj 项目文件，...
AI in Harness（一）
本文探讨了基于 Java 的开源 Loop-based Agent Harness 框架，旨在提升 AI 的执行效率。通过 Loop Engineerin...
Coinbase运行1200个代理，并将其AI费用削减了一半
Vercel CEO Guillermo Rauch and Coinbase CEO Brian Armstrong run very differen...
Meta的新Muse Image模型可以将其他Instagram用户融入AI生成的照片中
Meta is launching the first AI image generation model made by its Superintell...
观看AWS工程师使用OpenTelemetry和OpenSearch排除代理AI故障
Your organization constantly needs more information about system performance,...
Vercel收购Better Auth，为AI代理提供独立身份
AI agents increasingly act on people’s behalf, opening pull requests, reviewi...