小红花·文摘

AI 范式雷达：《生成-验证差距与自我修正失败》

Micropaper ·

五个开放源代码的全能AI模型：处理文本、图像、音频和视频

KDnuggets ·

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

量子位 ·

语言模型揭穿最大谎言：语言不需要指向现实就能产生连贯内容

极道 ·

杀进全球榜TOP2！国产视频模型黑马刚刚出现了

量子位 ·

文心5.0正式发布，支持文字、图像、音频和视频的全模态输入与输出，具备强大的理解与生成能力。其在多模态理解和情感分析方面表现突出，能够精准捕捉细节并进行复杂推理。新技术采用统一架构，提升训练与推理效率，参数规模超过2.4万亿，标志着百度在大模型领域的突破。

2.4万亿参数原生全模态，文心5.0一手实测来了

量子位 ·

AI教母李飞飞万字长文戳破LLM泡沫：生成语言只是起点，无法理解真实世界才是致命伤｜空间智能 Fei-Fei Li 世界模型人工智能 AI的下一个前沿

硕鼠的博客站 ·

RAG如何为您的数据赋能AI

ByteByteGo Newsletter ·

本研究提出WixQA基准，解决企业问答系统领域特定数据集不足的问题，通过构建多样化的问答数据集来评估检索与生成能力。研究表明WixQA有效支持企业环境中的RAG系统评估。

WixQA：企业检索增强生成的多数据集基准

BriefGPT - AI 论文速递 ·

本研究提出了CodeMixBench基准，用于评估大型语言模型在混合代码提示下的生成能力。研究发现，混合提示会导致模型性能下降，尤其是小型模型，揭示了多语言代码生成的挑战及未来发展方向。

CodeMixBench：基于混合代码提示评估大型语言模型的代码生成能力

BriefGPT - AI 论文速递 ·

本研究提出了一种新框架，将大型语言模型（LLMs）视为上下文敏感的语言生成器。通过分析变压器的上下文窗口和注意机制，揭示了其生成类人智能输出的能力，弥合了形式语言理论与变压器生成能力之间的鸿沟。

Moving Beyond Next-Token Prediction: Transformers as Context-Sensitive Language Generators

BriefGPT - AI 论文速递 ·

本研究提出CAFe框架，首次在大型视觉语言模型中同时提升表征学习与生成能力，推动多模态检索与生成基准的发展。

CAFe: Unifying Representation and Generation through Contrastive Autoregressive Fine-tuning

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型（LLMs）内部编码的事实知识与其输出之间的差距，发现内部知识显著高于外部表达，平均差距达到40%。这一发现揭示了LLMs生成能力的局限性。

内外部知识：大型语言模型中的隐含事实知识

BriefGPT - AI 论文速递 ·

本研究提出TRCE方法，针对文本到图像扩散模型中的恶意内容生成问题，采用双阶段概念消除策略，有效去除恶意概念，同时保留生成能力。

TRCE：朝着文本到图像扩散模型中可靠的恶意概念消除

BriefGPT - AI 论文速递 ·

Claude 3.7 Sonnet一战封神，画骑车鹈鹕、一键生成贪吃蛇，全网就它行

机器之心 ·

模型安全武装，复旦新研究实现SOTA扩散模型风险概念擦除效果，入选AAAI 2025

机器之心 ·

本研究提出了一种新方法，通过反向翻译自然语言代码切换句子并微调大语言模型，提升生成能力。结果显示文本流畅性良好，但评估指标与人类判断存在不一致。

基于自然发生数据生成代码切换文本的条件LLM方法

BriefGPT - AI 论文速递 ·

本研究针对图神经网络（GNNs）可信度不足的问题，提出了分类法和框架，并调查了代表性方法。结果显示，大型语言模型（LLMs）与GNNs结合可提升其语义理解和生成能力。

可信的图神经网络与大型语言模型：系统评审与分类

BriefGPT - AI 论文速递 ·

本研究提出了一种名为“提升与跳过”的无引导扩散方法，旨在提高少数样本的生成能力。该方法通过对标准生成过程进行两个小改动，显著提升了生成效率，优于传统的引导方法。

Boost-and-Skip: A Simple Guidance-Free Diffusion Method for Minority Sample Generation

BriefGPT - AI 论文速递 ·

理解生成协同促进？华为诺亚提出ILLUME，15M数据实现多模态理解生成一体化

机器之心 ·

AI 范式雷达：《生成-验证差距与自我修正失败》

五个开放源代码的全能AI模型：处理文本、图像、音频和视频

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

语言模型揭穿最大谎言：语言不需要指向现实就能产生连贯内容

杀进全球榜TOP2！国产视频模型黑马刚刚出现了

2.4万亿参数原生全模态，文心5.0一手实测来了

AI教母李飞飞万字长文戳破LLM泡沫：生成语言只是起点，无法理解真实世界才是致命伤｜空间智能 Fei-Fei Li 世界模型 人工智能 AI的下一个前沿

RAG如何为您的数据赋能AI

WixQA：企业检索增强生成的多数据集基准

CodeMixBench：基于混合代码提示评估大型语言模型的代码生成能力

Moving Beyond Next-Token Prediction: Transformers as Context-Sensitive Language Generators

CAFe: Unifying Representation and Generation through Contrastive Autoregressive Fine-tuning

内外部知识：大型语言模型中的隐含事实知识

TRCE：朝着文本到图像扩散模型中可靠的恶意概念消除

Claude 3.7 Sonnet一战封神，画骑车鹈鹕、一键生成贪吃蛇，全网就它行

模型安全武装，复旦新研究实现SOTA扩散模型风险概念擦除效果，入选AAAI 2025

基于自然发生数据生成代码切换文本的条件LLM方法

可信的图神经网络与大型语言模型：系统评审与分类

Boost-and-Skip: A Simple Guidance-Free Diffusion Method for Minority Sample Generation

理解生成协同促进？华为诺亚提出ILLUME，15M数据实现多模态理解生成一体化

AI教母李飞飞万字长文戳破LLM泡沫：生成语言只是起点，无法理解真实世界才是致命伤｜空间智能 Fei-Fei Li 世界模型人工智能 AI的下一个前沿