BriefGPT - AI 论文速递 ·

ViT3D对LLaMA3的对齐：3D医学图像报告生成

📝

内容提要

本研究旨在解决自动医学报告生成（MRG）中存在的效率低下问题。通过采用多模态大型语言模型，结合3D视觉变换器（ViT3D）处理3D扫描，提出了一种新的自动化报告生成方法。实验结果显示，该模型在MRG任务验证集上取得了0.3的平均Green分数，并在视觉问答任务验证集上达到了0.61的准确率，超越了基线模型，验证了ViT3D对LLaMA3的有效对齐在MRG和VQA任务中的潜力。

➡️

继续阅读

CVPR 2026 | PixelDiT：用于图像生成的像素扩散变换器
潜空间建模已成为扩散 Transformer（DiT）的标准范式。然而，它依赖于一个两阶段的流程，其中预训练的自编码器会引入有损重建，导致误差累积并阻碍联...
Claude Code之父：Harness保质期只有半年，解开缰绳吧
Claude code之父：大模型是有机生物，做好AI产品疏胜于堵
谷歌解散诺奖级项目AlphaFold 诺奖得主等核心成员已经加盟A社
#人工智能谷歌解散诺奖级项目 AlphaFold 团队，多名核心成员已经加盟 A 社继续研究人工智能技术。原团队成员主要被分配到 Gemini 部门和 ...
AI 加速了科学，也在掏空大学
科学家没有离开科学，科学正在离开大学#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
读诗有感
读到范成大《喜晴》中的诗句“连雨不知春去，一晴方觉夏深”。深圳连日阴雨，气温凉爽，实在感觉不到早已是盛夏时节。怕不是过段时间雨过天晴，要热哭了。
Robo.ai任命前国际刑警组织主席出任Alif Holding董事长
(全球TMT 2026年07月30日讯)Robo.ai Inc. 宣布，任命前国际刑警组织主席Ahmed N […]