BriefGPT - AI 论文速递 ·

LongWanjuan: 往长文本质量的系统测量

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

本文介绍了一种评估长文本质量的指标，并提出了专为增强语言模型在长文本任务上训练而设计的双语数据集。通过详细分析长文本，可以显著提高模型在长文本任务上的表现。

🎯

🏷️

“自然是我们所知的最具计算效率的系统”：Refiant如何利用群体优化技术构建一个1000万token的AI模型
Refiant推出了一个10百万token的上下文窗口模型Protea，旨在提高AI推理效率。该模型采用群体优化技术，能够处理完整的企业代码库和临床试验数...
[解决方案] macOS 27 Beta 3 launchd/logd进程持续高占用？搜狗输入法与系统的问题
升级到 macOS 27 Beta 3 后，搜狗输入法导致 launchd 和 logd 进程高占用 CPU 问题被确认，原因是其 LaunchAgent...
NVIDIA 发布 Audex (Nemotron-Labs-Audex-30B-A3B)：一种统一的音频-文本大语言模型
NVIDIA 发布了 Audex，这是一个统一的音频-文本大型语言模型，具备理解和生成音频及语音的能力，同时保持文本智能。Audex 采用 30 亿参数的...
AI in Harness（二）
文章讨论了通过错误恢复和任务系统增强大型语言模型（LLM）的能力。针对常见故障（如输出截断、输入过长等），提出了自我恢复的方法。任务系统将大目标拆分为小任...
使用GitHub代理工作流自动化跨仓库文档
Explore how the Aspire team turns merged product changes into SME-reviewed do...
预定三星即将发布的Galaxy手机可享$30信用额度
Even though they haven’t been officially announced yet, Samsung is giving you...