小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新策略，通过多模态微调方法显著改善OOD检测性能，关键在于正则化图像与文本嵌入间的距离，增强跨模态对齐。实验结果表明，该方法在ImageNet-1k OOD基准数据集上优于现有技术，达到最先进的检测表现。

Enhanced Out-of-Distribution Detection through Cross-Modal Alignment of Multi-Modal Representations

BriefGPT - AI 论文速递 ·

基于BLIP-2框架，开发了一种视觉语言模型，将病理报告文本与切片图像配对，形成图像-文本嵌入空间。该模型在超过35万张去标识化数据上评估，78%的生成文本被病理医师认为准确，展示了语言与WSI嵌入结合的潜力。

用于临床病理分析的大型视觉语言模型中的高效全面特征提取

BriefGPT - AI 论文速递 ·

基于BLIP-2框架，开发了一种视觉语言模型，将病理报告文本与切片图像配对，形成图像-文本嵌入空间。该模型在超过35万张去标识化数据上评估，78%的生成文本被病理医师认为准确，展示了语言与WSI嵌入结合的潜力。

将知识概念与全切片图像对齐以实现精确的组织病理图像分析

BriefGPT - AI 论文速递 ·