小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
打破密集瓶颈:Voyage-4-large如何利用混合专家(MoE)进行扩展

本文介绍了Voyage AI在嵌入模型扩展方面的研究,特别是通过混合专家(MoE)架构提高效率。Voyage-4-large模型实现了75%的参数减少,同时保持检索准确率,显著降低计算成本和延迟。MoE模型通过优化设计有效解耦知识容量与计算成本。

打破密集瓶颈:Voyage-4-large如何利用混合专家(MoE)进行扩展

Voyage AI
Voyage AI · 2026-03-03T22:26:12Z
Voyage 4模型系列:采用混合专家架构的共享嵌入空间

Voyage 4系列推出四种文本嵌入模型,具共享嵌入空间,支持不同模型间的互用。voyage-4-large采用混合专家架构,提升检索准确率并降低40%成本,适合高效检索需求的客户和开发者,支持多维度嵌入,优化查询与文档嵌入的独立调优。

Voyage 4模型系列:采用混合专家架构的共享嵌入空间

Voyage AI
Voyage AI · 2026-01-15T14:55:00Z

本研究提出了一种基于大型语言模型的接口,旨在帮助缺乏技术背景的居民更有效地使用家庭能源管理系统(HEMS)。该接口能够理解用户的错误输入并输出正确参数,平均检索准确率达到88%,显著提高了HEMS的使用效率。

Large Language Model Interface for Home Energy Management Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究提出了一种名为EMS的新方法,以提高大规模语言模型中KV缓存的压缩效率。该方法结合全局与局部得分,更有效地识别令牌的重要性。实验结果表明,EMS在极端压缩比下仍能保持先进性能,降低困惑度,并显著提高多项任务的检索准确率。

EMS: Adaptive Evict-then-Merge Strategy for Head-wise KV Cache Based on Global-Local Importance

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z
voyage-multimodal-3:文本、图像和截图的全能嵌入模型

voyage-multimodal-3是一种新型多模态嵌入模型,能够同时处理文本和图像,提升检索准确率19.63%。该模型简化了文档解析,支持复杂布局的PDF和截图,解决了传统模型的模态差距问题,适用于知识库的语义搜索。

voyage-multimodal-3:文本、图像和截图的全能嵌入模型

Voyage AI
Voyage AI · 2024-11-12T10:00:00Z

该文介绍了一种利用抽象摘要生成简洁查询的方法,可以在现有数据集的检索系统中提高检索准确率。通过微调和开箱即食的摘要模型,检索准确率提高了3倍。

CLAIMSCAN-2023: 社交媒体中揭示真相的概述 —— 通过索引主张的检测和识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-30T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码