亚马逊AWS官方博客 ·

使用优化型读取和 pgvector，提高 Amazon Aurora 上生成式人工智能工作负载的性能

💡 原文中文，约6000字，阅读约需15分钟。

📝

内容提要

这段文字已经是简体中文。

🎯

关键要点

一些应用场景需要实时进行高性能的向量比较，存储数百万到数十亿个向量嵌入体。
Amazon Titan Embeddings G1模型生成1536维的嵌入体，内存无法容纳整个向量索引。
Amazon Aurora优化型读取提升向量工作负载性能，减少资源使用。
结合pgvector HNSW索引，查询性能提升20倍，提供低延迟响应。
使用HNSW索引的优化型读取实例，平均查询吞吐量性能提高多达九倍。
相似度搜索分为KNN和ANN，KNN返回最相关结果，ANN性能更高。
嵌入模型生成的向量占用大量内存，KNN操作需移动5.7 TiB数据。
Aurora优化型读取使用NVMe本地SSD存储临时数据，改善读取延迟和吞吐量。
优化型读取缩短查询延迟9倍，适用于超出数据库实例内存容量的大型数据集。
基准测试使用BIGANN Benchmark，评估使用和不使用优化型读取的性能。
基准测试关注性能和查全率，ANN算法管理查全率与查询吞吐量的取舍。
优化型读取实例的查询吞吐量平均高出6到7倍，消除磁盘I/O瓶颈。
优化型读取实例的CPU利用率高达95%，而标准实例未超过15%。
优化型读取为向量工作负载提供高性能、经济实惠的解决方案。
并非所有向量工作负载都能从优化型读取中受益，更新频繁的向量数据可能不适用。
Aurora优化型读取提供高性能、经济实惠的选项，适合超出实例内存的向量工作负载。
开发者可使用SQL和pgvector在Aurora PostgreSQL中执行向量相似度搜索，构建生成式AI应用。

❓

延伸问答

Amazon Aurora 优化型读取如何提升向量工作负载的性能？

Amazon Aurora 优化型读取通过结合 pgvector HNSW 索引，提升查询性能，减少资源使用，查询吞吐量可提高多达九倍。

使用 HNSW 索引的优势是什么？

HNSW 索引相比于 IVFFlat 索引，查询性能提升可达 20 倍，适合处理大规模向量数据。

Aurora 优化型读取适合哪些应用场景？

适合超出数据库实例内存容量的大型数据集应用，如实时高性能向量比较和相似度搜索。

Aurora 优化型读取的成本效益如何？

优化型读取实例的查询成本比标准实例低 75-80%，提供高性价比的解决方案。

Aurora 优化型读取在基准测试中的表现如何？

基准测试显示，优化型读取实例的查询吞吐量平均高出 6 到 7 倍，CPU 利用率可达 95%。

并非所有向量工作负载都能从优化型读取中受益，为什么？

更新频繁的向量数据可能不适用优化型读取，因为它主要缓存未修改的被逐出分页。

🏷️

标签

pgvector 人工智能关键词处理文章摘要简体中文翻译

➡️

继续阅读

WebRTC 与实时应用开发的智能体工作流
本文借鉴在 WebRTC.ventures 开发实际系统过程中积累的经验。介绍在构建实时应用程序时使用的工作流程：作为项目核心的上下文文件、将会话上下文转...
人工智能带来的生产力提升更接近 10%，而非10倍！
研发团队用了AI编程工具，代码产量中位数只涨了百分之八。四百多家公司两整年的数据砸到脸上，AI工具使用率飙升六成五，写代码速度才挪了不到八个百分点。技术...
Best in Class: Stream PC Games and Study on the Same Laptop With GeForce NOW
Back to school means balancing assignments, deadlines and downtime. GeForce N...
When do AI agents need permission boundaries?
An AI agent feels harmless when it only produces text, but the risk profile c...
Dogfooding at scale: migrating cdnjs to Cloudflare’s Developer Platform
We moved cdnjs, serving 9 billion requests a day, entirely onto Cloudflare...
Transform any place with Nano Banana in Google Earth
A hero image with example queries is shown.