小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

向佑是一个1024维的向量,出生于混沌的向量空间。通过随机划分空间,他被找到并使用局部敏感哈希(LSH)策略定位。

盘古开天辟地也只才一次…

王福强
王福强 · 2025-10-09T16:00:00Z

研究人员提出了MagicPIG,通过在CPU上应用局部敏感哈希(LSH)技术,显著提升了大模型解码吞吐量1.76至4.99倍,减轻了GPU内存压力,并提高了推理质量和准确率。这项研究探索了异构计算的潜力,有望降低模型部署成本。

把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

量子位
量子位 · 2024-12-27T05:59:43Z
第30天:Reformer:大规模模型的高效Transformer

Reformer模型通过局部敏感哈希注意力和可逆层显著降低了内存和计算成本,同时保持高准确性,适用于长序列的语言建模、文档分析和基因组学等任务,提升了计算效率和可扩展性。

第30天:Reformer:大规模模型的高效Transformer

DEV Community
DEV Community · 2024-11-09T13:03:30Z

本研究提出MagicPIG系统,利用局部敏感哈希(LSH)解决大语言模型KV缓存的瓶颈问题。MagicPIG在多种任务中显著减少注意力计算量,同时保持高准确率,解码速度提升1.9到3.9倍。

MagicPIG:高效大语言模型生成的LSH采样

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z
理解近似最近邻(ANN)算法

近似最近邻(ANN)算法用于在大数据集中快速找到与查询点相近的数据点。与传统最近邻(NN)算法相比,ANN通过智能捷径和数据结构提高搜索效率,适用于大规模和高维数据。ANN在推荐系统和实时应用中表现优异。不同类型的ANN算法如KD树和局部敏感哈希(LSH)各有优缺点,选择时需考虑数据规模、准确性和计算资源。

理解近似最近邻(ANN)算法

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2024-04-17T00:00:00Z

HyperAttention是用于解决大型语言模型计算挑战的近似注意力机制,具有模块化设计,能够与其他底层实现集成。通过使用局部敏感哈希来识别大条目,HyperAttention比现有方法更快,能够加快推理时间并提高困惑度。对于更大的上下文长度,HyperAttention能够实现5倍的加速。

通过正交内存实现线性关注

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码