小红花·文摘

谷歌发布了Gemini 2.0，这是其最新的AI模型，具备多模态输出、图像生成和音频输出等新功能。开发者可以通过Gemini API构建应用，模型还用于多个研究原型项目，强调安全和责任。用户可提前体验该模型，谷歌云客户也可使用第六代TPU Trillium。

The Keyword ·

新的上下文学习方法SimICL结合自监督学习，成功应用于腕部超声数据集，显著提高了骨骼结构分割效果，并减少了人工标注时间。MetaICL框架通过元训练提升了少样本学习效果，优于传统方法。此外，研究提出了多模态输出的上下文学习框架，增强了视觉理解能力。

BriefGPT - AI 论文速递 ·

该文介绍了一种名为JAM框架的模块化方法，用于将文本和图像生成模型集成到一个强大的模型中，实现无缝多模态输出。作者还引入了一种高效的数据调优策略，为混合模态生成任务量身定制。最终调优的模型表现出了无与伦比的性能，是首个明确设计用于此目的的模型。

BriefGPT - AI 论文速递 ·