BriefGPT - AI 论文速递 ·

弥合创造力理解差距：小规模人类对齐实现大规模语言模型的专家级幽默排名

💡 原文中文，约700字，阅读约需2分钟。

📝

内容提要

本研究探讨了大规模语言模型在幽默理解方面的不足，通过将幽默理解分解为三个部分并进行改进，达到了82.4%的字幕排名准确率，超越了67%的基准，接近人类专家水平。这表明与特定群体对齐能有效提升模型的创意判断能力。

🎯

🏷️

活动报名丨人类一败涂地十周年来到游戏博物馆！
人类一败涂地十周年关卡合作挑战赛十年摇晃，快乐不减！为庆祝《人类一败涂地》十周岁生日，CurveGames 诚邀大家参加十周年关卡合作挑战赛！⏰时间：20...
俄罗斯指控Telegram创始人协助(乌兰克)进行恐怖主义活动已发布国际通缉令
#行业资讯俄罗斯指控 Telegram 创始人帕维尔杜罗夫协助恐怖主义活动，目前已通过国际刑警组织向杜罗夫发出国际通缉令。俄罗斯称 Telegram 长...
高通和 IDC 说，智能眼镜会是手机之外，最重要的 AI 设备
AI 将会成功智能设备的基础能力。#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
GPT-5.6自己优化自己实锤了，新的左脚踩右脚已经出现
OpenAI的RSI焚诀，它来了！
李飞飞的世界模型，终于开始训练机器人了
李飞飞老师的World Labs，补了块关键拼图
CVPR 2026 | PixelDiT：用于图像生成的像素扩散变换器
潜空间建模已成为扩散 Transformer（DiT）的标准范式。然而，它依赖于一个两阶段的流程，其中预训练的自编码器会引入有损重建，导致误差累积并阻碍联...