HyperAI超神经 ·

【vLLM 学习】Vision Language Embedding

💡 原文中文，约4300字，阅读约需11分钟。

📝

内容提要

本文介绍了如何使用vLLM进行离线推理，生成多模态嵌入，并展示了符合HuggingFace模型库规范的文本和图像提示格式。

🎯

关键要点

本文介绍了如何使用vLLM进行离线推理。
展示了在视觉语言模型上生成多模态嵌入的正确提示格式。
提示格式应遵循HuggingFace模型库中的示例格式。
定义了多种查询类型，包括文本查询、图像查询和文本+图像查询。
提供了生成模型请求数据的函数，支持不同的查询模态。
实现了两个主要的模型运行函数：run_e5_v和run_vlm2vec。
run_e5_v函数处理文本和图像的嵌入请求。
run_vlm2vec函数根据输入的文本或图像生成相应的提示。
提供了获取查询的函数，根据模态返回相应的查询数据。
主函数解析命令行参数并调用相应的模型运行函数。

❓

延伸问答

vLLM是什么？

vLLM是一种用于离线推理的模型，能够生成多模态嵌入。

如何使用vLLM生成多模态嵌入？

使用vLLM时，需要遵循HuggingFace模型库中的提示格式，并调用相应的模型运行函数。

vLLM支持哪些查询模态？

vLLM支持文本查询、图像查询和文本+图像查询三种模态。

run_e5_v函数的作用是什么？

run_e5_v函数用于处理文本和图像的嵌入请求，并生成相应的提示。

如何获取查询数据？

可以使用get_query函数，根据指定的模态返回相应的查询数据。

vLLM的主要模型运行函数有哪些？

vLLM的主要模型运行函数包括run_e5_v和run_vlm2vec。

🏷️

继续阅读

[官方途径] ChatGPT账号被封禁/误封后如何联系OpenAI提交申诉
#人工智能官方途径：ChatGPT 账号被封禁 / 误封后如何联系 OpenAI 提交申诉。昨天 OpenAI 大规模封号后开始解封部分账号，但并非所有...
OpenAI大规模封号后正在陆续解封账号向掉订阅用户赠送1个月订阅作为补偿
#人工智能 OpenAI 大规模封号后正在陆续解封账号，向掉订阅用户赠送 1 个月订阅作为补偿。此次封号与 IP 质量、订阅开通方式基本没关系，因为有在美...
2026 Apple 设计奖正式揭晓，细数 12 款 App 的特别之处
苹果设计大奖公布了2026年获奖名单，涵盖乐趣、多元、创新、互动、社会影响和视觉六大类。获奖作品包括《grug》、《Is This Seat Taken?...
从感知智能到智能体 AI：高通汽车中国布局深化加速
高通汽车业务在2026财年第二季度营收达13亿美元，同比增长38%。预计年收入将突破60亿美元。高通与多家企业合作，推动智能体技术，提升汽车AI能力。其核...
别乱加设置开关，你的软件就是这么烂掉的
文章探讨了软件开发中配置开关的过度使用如何导致复杂性和维护困难。虽然开关最初提供灵活性，但随着时间推移，它们成为维护负担，增加了Bug和用户困惑。作者建议...
企业文档安全最佳实践（一）：告别混乱，从“分类分级与密级标识”开始
在数字化办公时代，企业文档管理面临挑战。有效的文档安全策略应通过分类分级和密级标识实施，将文档分为五个安全等级，并制定相应保护措施，以提高效率、降低风险并...