派早报:Google 发布 Gemini Embedding 2 模型等

💡 原文中文,约3000字,阅读约需7分钟。
📝

内容提要

谷歌于3月11日发布了Gemini Embedding 2模型,这是首个支持文本、图像和视频等多模态输入的嵌入模型,能够识别100种语言的语义意图,简化数据处理并增强应用能力。该模型已通过Gemini API和Vertex AI提供预览。

🎯

关键要点

  • 谷歌于3月11日发布Gemini Embedding 2模型,这是首个支持多模态输入的嵌入模型。
  • Gemini Embedding 2能够识别100种语言的语义意图,简化数据处理流程。
  • 该模型支持文本、图像、视频、音频和文档等多种输入类型。
  • 应用场景包括检索增强生成、语义搜索、情感分析和数据聚类。
  • Gemini Embedding 2可以在一次请求中接收多种输入类型,分析不同媒体之间的关系。
  • 目前,该模型已通过Gemini API和Vertex AI提供公开预览。
➡️

继续阅读