小红花·文摘 - 小红花技术领袖俱乐部

coSTAR：我们如何在Databricks快速交付AI代理而不出错

coSTAR：我们如何在Databricks快速交付AI代理而不出错

Databricks ·

在国际数学奥林匹克组织的支持下，IMO 2025项目由多个团队合作完成，Thang Luong和Edward Lockhart负责协调。项目依赖于Deep Think团队的研究，专家们提供了数据和评估，最终确认提交的答案完整且正确。

深度思维的高级版双子星在国际数学奥林匹克上正式达到了金牌标准

Google DeepMind Blog ·

本研究探讨了审稿人信心评分与评审内容的一致性，提出了利用深度学习和自然语言处理技术的方法。研究发现，高信心评分与论文被拒绝存在相关性，验证了专家评估的公正性。

Are Reviewer Confidence Scores Consistent with Review Content? Evidence from Top AI Conference Proceedings

BriefGPT - AI 论文速递 ·

本研究针对国家技术图书馆开放存取目录的自动主题标签化问题，提出了一种基于多种大语言模型的组合方法。通过少量示例训练和后处理步骤，我们有效地将生成的关键词映射到目标词汇，并通过专家评估取得最佳结果。

DNB-AI Project at SemEval-2025 Task 5: An Ensemble Approach for Automated Subject Indexing Based on LLM

BriefGPT - AI 论文速递 ·