The Verge ·

谷歌的Gemini 1.5 Pro现在可以听见

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

Google更新了Gemini 1.5 Pro模型，具备听力功能，无需书面转录。Gemini 1.5 Pro超越了最强大的模型Gemini Ultra。Google还将在Imagen 2上添加修复和填充功能，并应用SynthID数字水印功能。Google公开预览了将AI响应与Google搜索联系起来的方法。Gemini故意不回答与2024年美国选举有关的问题。

🎯

关键要点

Google更新了Gemini 1.5 Pro模型，具备听力功能，可以处理上传的音频文件，无需书面转录。
Gemini 1.5 Pro首次通过Vertex AI平台向公众开放，超越了最强大的Gemini Ultra模型。
Gemini 1.5 Pro能够理解复杂指令，消除了微调模型的需求。
Gemini 1.5 Pro目前仅对Vertex AI用户开放，普通用户通过Gemini聊天机器人接触Gemini语言模型。
Imagen 2模型将增加修复和填充功能，并在所有生成的图片上应用SynthID数字水印功能。
许多新功能，如修复和填充，已经在其他文本到图像模型中存在。
Google正在公开预览将AI响应与Google搜索结合的方法，以提供最新信息，但故意不回答与2024年美国选举相关的问题。

❓

延伸问答

Gemini 1.5 Pro的新功能是什么？

Gemini 1.5 Pro现在具备听力功能，可以处理上传的音频文件，无需书面转录。

Gemini 1.5 Pro与Gemini Ultra相比有什么优势？

Gemini 1.5 Pro在性能上超越了Gemini Ultra，并能理解复杂指令，消除了微调模型的需求。

谁可以使用Gemini 1.5 Pro？

目前Gemini 1.5 Pro仅对Vertex AI用户开放，普通用户通过Gemini聊天机器人接触Gemini语言模型。

Google对Imagen 2模型进行了哪些更新？

Imagen 2将增加修复和填充功能，并在所有生成的图片上应用SynthID数字水印功能。

Google如何将AI响应与搜索结合？

Google正在公开预览将AI响应与Google搜索结合的方法，以提供最新信息。

Gemini 1.5 Pro是否会回答与2024年美国选举相关的问题？

Google故意不让Gemini回答与2024年美国选举相关的问题。

🏷️