小红花·文摘

检索做大，生成做轻：CMU团队系统评测RAG的语料与模型权衡

机器之心 ·

CMU研究发现，数学能力强的大模型在其他领域的表现有限。只有通过强化学习（RL）训练的模型能够有效迁移数学推理技能，而监督微调（SFT）可能导致负迁移。研究表明，微调方法是影响迁移能力的关键，RL模型在保持原有知识的同时提升了特定领域的表现。

大模型刷数学题竟有害？CMU评估20+模型指出训练陷阱

量子位 ·

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

机器之心 ·

逐个token太慢！大模型原生并行出token，CMU、英伟达新作Multiverse

机器之心 ·

03 - Multi-Version Concurrency Control [Design Decisions] (CMU Databases / Spring 2020)

Josherich的博客 ·

02 - In-Memory Databases (CMU Databases / Spring 2020)

Josherich的博客 ·

CMU朱俊彦等上新LEGOGPT，一句话就能搭乐高，网友：复杂零件行不行？

机器之心 ·

本研究针对多模态情感分析中的不足，采用基于变压器的模型通过早期融合整合文本、音频和视觉信息。研究结果显示，该模型在测试集上实现了97.87%的七分类准确率和0.9682的F1分数，展示了早期融合在跨模态交互捕捉方面的有效性。

基于变压器模型的CMU-MOSEI数据集多模态情感分析

BriefGPT - AI 论文速递 ·

北大、清华、UvA、CMU等联合发布：大模型逻辑推理能力最新综述

机器之心 ·

HPE Insight集群管理工具v8.2存在关键无认证远程代码执行漏洞（CVE-2024-13804），攻击者可绕过认证以root权限执行任意命令。该漏洞源于设计缺陷，影响高性能计算集群管理。HPE已停止发布安全补丁，建议用户实施网络隔离以降低风险。

惠普HPE CMU曝高危漏洞：攻击者可绕过认证执行远程命令（CVE-2024-13804）

FreeBuf网络安全行业门户 ·

Today we’re going to get started for today so I hope everyone had a great spring break and the weather here is a lot warmer.

CMU Advanced NLP Spring 2025 (15): Quantization (Guest: Tim Dettmers)

Josherich的博客 ·

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

机器之心 ·

CMU Advanced NLP Spring 2025 (11): Reinforcement Learning

Josherich的博客 ·

#09 - Search Parallelization: Bottom-up (CMU Optimize!)

Josherich的博客 ·

清华与CMU团队的研究表明，长思维链（CoT）推理能力可以通过强化学习（RL）实现，监督微调（SFT）并非必需，但能提升效率。研究强调奖励函数对CoT扩展的重要性，并指出模型具备自我纠错能力。未来的研究将集中在模型规模和RL基础设施的改进上。

检索做大，生成做轻：CMU团队系统评测RAG的语料与模型权衡

大模型刷数学题竟有害？CMU评估20+模型指出训练陷阱

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

逐个token太慢！大模型原生并行出token，CMU、英伟达新作Multiverse

03 - Multi-Version Concurrency Control [Design Decisions] (CMU Databases / Spring 2020)

02 - In-Memory Databases (CMU Databases / Spring 2020)

CMU朱俊彦等上新LEGOGPT，一句话就能搭乐高，网友：复杂零件行不行？

基于变压器模型的CMU-MOSEI数据集多模态情感分析

北大、清华、UvA、CMU等联合发布：大模型逻辑推理能力最新综述

惠普HPE CMU曝高危漏洞：攻击者可绕过认证执行远程命令（CVE-2024-13804）

CMU Advanced NLP Spring 2025 (15): Quantization (Guest: Tim Dettmers)

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

CMU Advanced NLP Spring 2025 (11): Reinforcement Learning

#09 - Search Parallelization: Bottom-up (CMU Optimize!)

SFT并非必需！推理模型仅靠RL就能获得长思维链能力，清华CMU团队破解黑盒

宇树机器人成赛博科比！英伟达CMU新研究，投篮模仿篮球巨星，代码论文全开源

数据不够致Scaling Law撞墙？CMU和DeepMind新方法可让VLM自己生成记忆

CMU把具身智能的机器人给越狱了

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

CMU 研究人员发布 Pangea-7B：适用于 39 种语言的完全开放多模态大型语言模型 MLLM