小红花·文摘

GPT-6八月发布？150万上下文窗口真相

极道 ·

查德·福勒研究了本地大型语言模型（LLM）生成代码的效果。他调整了代码以适应本地模型，并测试了多个模型的表现。大多数模型的结果与他的研究相似，但glm-4.7-flash模型表现不佳，输出冗长且常常偏离正确答案。作者希望通过此实验鼓励更多人参与改进和贡献数据，以更好地理解这些模型的能力。

研究：大型语言模型的默认语言是什么？

Neward & Asocciates, LLC Blog ·

Harness工程来自loser死磕：每次失败都变成永久规则

极道 ·

Claude Code难度等级Low/Medium/High/Max完整对比与使用指南

极道 ·

减少灌输以容纳更多：训练数据修剪提升事实记忆能力

Apple Machine Learning Research ·

绩效改进计划 — 稳固的融合

Lifelog — A Mythology-Driven Devlog ·

链式思维在推理中的潜力：对轨迹动态的深入探讨

Apple Machine Learning Research ·

VisionWeaver：从“现象识别”到“病因诊断”，开启AI视觉幻觉研究新篇章

实时互动网 ·

全球首个AI投资大赛落幕，阿里千问Qwen以20%收益夺冠，DeepSeek位居第二，美系模型普遍亏损，GPT-5仅剩三成。比赛考验模型的理解力和执行稳定性，Qwen表现优异，成为首个在真实交易中获胜的AI。

全球首个AI投资大赛落幕！阿里Qwen 20%收益夺冠，GPT-5亏到只剩三成

量子位 ·

Switchboard-Affect：来自对话语音的情感感知标签

Apple Machine Learning Research ·

AI 智能体的上下文工程：实用指南

宝玉的分享 ·

NVIDIA AI 发布 ProRLv2：通过扩展强化学习 RL 推进语言模型推理

实时互动网 ·

变换器模型中的混合专家架构

MachineLearningMastery.com ·

本研究提出了一种结合大语言模型与图像生成模型的语义进化框架，旨在解决模型对特定语义概念的敏感性问题，识别影响模型表现的敏感语义，并验证了该方法的有效性。

Blind Spot Navigation: Evolutionary Discovery of Sensitive Semantic Concepts in Large Visual Language Models

BriefGPT - AI 论文速递 ·

本文研究中介标记的语义对模型表现的影响，发现模型即使在正确推理轨迹上也会生成无效轨迹，并且在使用噪声轨迹时表现良好，表明中介标记与解决方案的准确性关系不强。

Beyond Semantics: The Unreasonable Effectiveness of Groundless Intermediate Markers

BriefGPT - AI 论文速递 ·

ChatGPT的新功能“深度研究”现已能连接GitHub，用户可以实时获取和分析代码库数据。该功能仍在测试中，未来将向更多用户开放。同时，OpenAI推出了强化微调（RFT），以提升模型在复杂领域的表现。

刚刚，ChatGPT的深度研究可以连接GitHub了！网友：这是真·RAG

量子位 ·

一名开发者接受了优化器的任务，旨在核范数下最小化近似误差并训练NanoGPT模型。尽管对任务理解不足，他记录了学习过程和实验结果，最终发现优化方向错误，导致模型表现不佳。

在核范数下推导和实现优化器

Nathan Chen ·

本研究提出了一种低秩自适应结构先验（LoASP）方法，旨在解决糖尿病性视网膜病分级中的领域泛化问题，提升模型在不同数据源上的表现，并增强可解释性，为诊断提供新思路。

Low-Rank Adaptive Structural Prior for Generalizable Diabetic Retinopathy Grading

BriefGPT - AI 论文速递 ·

本研究提出了FreshStack，一个自动构建技术文档检索评估基准的框架。该框架通过自动收集文档和生成相关内容，提升了检索质量，显示出当前模型在此基准上的表现有待改善。

FreshStack：构建评估技术文档检索的真实基准

BriefGPT - AI 论文速递 ·

本文探讨了大型推理模型在推理路径优化方面的不足，提出了一种受蒙特卡罗树搜索启发的追溯搜索算法，以提炼高质量推理路径。研究表明，该方法显著减少了推理长度并提升了模型表现，展示了搜索算法在推理模型中的改进潜力。

Retro-Search: Exploring Untaken Paths for Deeper and More Efficient Reasoning

BriefGPT - AI 论文速递 ·