小红花·文摘 - 小红花技术领袖俱乐部

RetinalGPT是一种基于大型视觉语言模型的视网膜临床对话助手，旨在改善视网膜图像解析的不足。通过构建大型数据集和创新的数据处理管道，RetinalGPT在视网膜疾病诊断中超越传统模型，推动可解释性临床研究的发展。

RetinalGPT: A Retinal Clinical Preference Conversational Assistant Based on Large Vision-Language Models

BriefGPT - AI 论文速递 ·

阿里云通义开源Qwen2.5-VL，视觉理解能力全面超越GPT-4o

阿里云通义开源Qwen2.5-VL，视觉理解能力全面超越GPT-4o

机器之心 ·

九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊

九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊

机器之心 ·

Anthropic发布新款Claude模型及计算机使用功能

Anthropic发布新款Claude模型及计算机使用功能

InfoQ ·

本文研究了统一感知分析任务，提出了UPerNet多任务框架和训练策略，以识别图像中的视觉概念。整合语义分割和实例分割，开发了高效的图像解析方法，并探讨了基于深度学习的人体解析技术的进展与挑战。

BiomedParse：一种针对一切地方一次性进行图像解析的生物医学基础模型

BriefGPT - AI 论文速递 ·

OpenAI即将推出一款多模态AI数字助手

OpenAI即将推出一款多模态AI数字助手

The Verge ·