BriefGPT - AI 论文速递 ·

LongBench: 一个用于长篇上下文理解的双语多任务基准

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

通过全面评估8个大型语言模型，发现商业模型GPT-3.5-Turbo-16k在长语境下表现优于其他开源模型，但仍存在困难。缩放位置嵌入和微调对长语境理解有实质性改进。上下文压缩技术改善了长上下文能力较弱的模型，但性能仍落后于具有强大长上下文理解能力的模型。

🎯

🏷️

微软押注企业AI竞赛将依赖数据上下文而非模型能力
微软在Build 2026开发者大会上推出了Microsoft Fabric，旨在解决企业AI中的数据上下文问题。新平台包括HorizonDB数据库、GP...
查询标签：您的数据仓库查询所缺失的上下文
Databricks推出了查询标签功能，允许用户为每个SQL执行添加自定义业务上下文，以便追踪和分析查询。通过自动标记，用户可以识别查询来源、成本中心和项...
微软与OpenAI分道扬镳——现在他们准备好迎战了
微软在Build大会上宣布了一系列新的AI计划，包括自家开发的推理模型MAI-Thinking-1，旨在满足企业需求。此外，微软推出了集成多种AI助手的“...
教你薅token：构建agent无关的AI工作流
目前使用AI的主要痛点是高昂的账单。用户可以通过维护良好的文档来优化使用流程，减少对高价Agent的依赖。合理利用免费资源可以节省开支，维护好文档有助于降...
Core Data + Observation：从属性级响应到心智解放
Observation 框架提升了 SwiftUI 的状态响应能力，支持属性级观察，减少无效刷新。CDE 实现了对 Observation 的支持，使 N...
Python文件写入指南：初学者入门
本文介绍了Python文件写入的基本技能，包括创建文本文件、写入多行、追加内容、使用不同文件模式（如w、a、x、r）以及保存CSV和JSON格式的数据。推...