小红花·文摘

稳定扩散模型在视觉上下文学习中表现优异

Apple Machine Learning Research ·

本文介绍了一种新型的原型提示学习法（PTP），用于视觉语言模型中的少量样本图像识别。该方法通过定义图像和提示原型，提高了模型的适应性和准确性，实验结果在多个数据集上表现优异。同时，研究探讨了基于贝叶斯理论的关键词学习和黑盒视觉提示的少样本学习，强调视觉上下文学习的重要性和有效性。

训练空间-频率视觉提示和概率聚类以实现准确的黑箱迁移学习

BriefGPT - AI 论文速递 ·

本研究探讨了视觉-语言模型中的上下文学习，发现文本信息对其性能影响显著。提出了MMICES方法，结合视觉和语言模态以提升效果。同时引入了新颖的视觉上下文学习方法，解决大型视觉语言模型中的挑战，并提出多模态ICL方法，在复杂推理任务中表现优异。

该研究提出了一种使用上下文学习方法进行湿疹分割的策略，只需要少量示例图像即可，与使用428个图像进行训练的CNN U-Net相比，使用训练数据集中仅有的2个代表图像训练的SegGPT表现更好。同时，研究还发现在SegGPT中使用更多的示例图像可能对其性能有害，这强调了在皮肤成像任务中发展更快更好的解决方案时，视觉上下文学习的重要性。该研究结果为开发能够满足训练数据中通常严重不足的少数群体的包容性解决方案铺平了道路。

少样本湿疹分割的视觉情境学习

BriefGPT - AI 论文速递 ·

稳定扩散模型在视觉上下文学习中表现优异

训练空间-频率视觉提示和概率聚类以实现准确的黑箱迁移学习

面向视觉与语言模型的多模态上下文学习

少样本湿疹分割的视觉情境学习