小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了构建向量搜索引擎的过程,包括整体架构、距离函数、HNSW索引、乘积量化、WAL和mmap等关键技术。向量搜索引擎分为API层、索引层和存储层,采用HNSW作为索引,使用WAL实现崩溃恢复,并通过mmap优化内存管理。文章还探讨了距离计算加速方法和元数据过滤策略,并提供了一个用Go实现的简化版本。

从零实现一个向量搜索引擎

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-06-02T00:00:00Z

Cloudflare 正在为 AI 智能体推出实时网页搜索功能,允许开发者通过 API 查询互联网内容。这项功能旨在减少 AI 模型的过时回答和错误,提高查询准确性。目前仅限受邀开发者使用,未来是否提供免费额度尚未确定。

Cloudflare将推出面向AI智能体的搜索引擎 为智能体提供实时公开网页访问能力

蓝点网
蓝点网 · 2026-06-01T00:30:13Z

本文探讨了编辑距离及其在拼写纠错和模糊搜索中的应用,重点介绍了Levenshtein距离、动态规划算法、Myers位并行算法和BK-tree等数据结构,以提高计算效率。同时讨论了实际应用中的陷阱与优化策略,强调选择合适算法的重要性。

编辑距离与模糊匹配:搜索引擎的纠错秘密

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-24T00:00:00Z
后搜索时代的谷歌时代开始了

谷歌正在转型为一个主动搜索的AI代理,而不仅仅是一个搜索引擎。Vergecast讨论了谷歌在AI生态系统中的信心及其对网络未来的影响,并提到谷歌I/O大会的最新动态和即将推出的每日播客。

后搜索时代的谷歌时代开始了

The Verge
The Verge · 2026-05-22T13:47:41Z
为OpenClaw搭建一个免费的搜索引擎,如何让OpenClaw搜索网页内容

本文介绍了如何使用SearXNG搭建免费的开源搜索引擎。通过Docker Compose进行部署,用户可以配置相关文件并启动服务。设置完成后,用户可通过指定端口访问搜索引擎,实现无限制的网页搜索,避免使用第三方API。

为OpenClaw搭建一个免费的搜索引擎,如何让OpenClaw搜索网页内容

张洪Heo
张洪Heo · 2026-05-22T03:11:38Z

现代人工智能系统越来越依赖多模态数据,尤其是图像理解。MySQL HeatWave GenAI使得在SQL工作流中直接实现图像理解成为可能,通过生成文本描述并转化为向量嵌入,提供可解释的语义检索。这种方法降低了基础设施成本,简化了AI系统的构建,使其更易于理解和管理。

使用MySQL HeatWave GenAI构建AI视觉搜索引擎

Planet MySQL
Planet MySQL · 2026-05-14T16:54:52Z

我体验了New Bing,这是一款基于人工智能的搜索引擎聊天机器人。它能回答问题并提供幽默对话,引用来源的准确性优于ChatGPT。尽管在某些问题上表现不如预期,但整体体验更佳,未来可能更受欢迎。

体验 New Bing:一个比 ChatGPT 更强大、更幽默、更有用的搜索引擎聊天机器人

了迹奇有没
了迹奇有没 · 2026-04-30T06:18:05Z
如何将PostgreSQL用作缓存、任务队列和搜索引擎

本文探讨了PostgreSQL的性能基准测试,比较了标准PostgreSQL与优化版本在缓存、任务队列、全文搜索和发布/订阅方面的表现。结果显示,使用UNLOGGED表进行缓存可提高13%的性能,SKIP LOCKED适用于任务队列,tsvector显著提升全文搜索效率,LISTEN/NOTIFY可替代Redis进行消息传递。整体而言,PostgreSQL能够满足大多数应用需求,减少基础设施复杂性。

如何将PostgreSQL用作缓存、任务队列和搜索引擎

freeCodeCamp.org
freeCodeCamp.org · 2026-04-21T16:58:55Z
发布周总结:2026年4月五天内发布的所有内容

Meilisearch在2026年4月发布了多项新功能,包括云端分片和复制、企业级身份验证、聊天接口及搜索性能检查工具。这些更新旨在提升搜索引擎的可扩展性、安全性和智能化,支持动态搜索规则,满足企业和开发者的需求。

发布周总结:2026年4月五天内发布的所有内容

meilisearch blog
meilisearch blog · 2026-04-20T00:00:00Z
如何在 Web 应用程序中优化 Elasticsearch 搜索

Elasticsearch 是一个由 Apache 构建的搜索引擎,提供高级文本和向量搜索功能。本文介绍了如何在 Node.js 环境中设置和使用 Elasticsearch,包括索引创建、文档管理和搜索实现,旨在提升应用程序的搜索效率。

如何在 Web 应用程序中优化 Elasticsearch 搜索

freeCodeCamp.org
freeCodeCamp.org · 2026-04-16T16:25:38Z
美国住宅代理:本地IP准确性对搜索引擎结果、广告和定价的重要性

到2026年,互联网的“位置”概念已发展为邻里级别,影响用户所见内容。搜索引擎和广告平台根据邮政编码等信号动态调整输出。美国住宅代理服务器成为确保数据准确性和避免检测的关键基础设施,现代数字营销强调超本地化,精准的地理信号对SEO和广告至关重要。住宅代理提供真实用户体验的数据,帮助企业在竞争中获得优势。

美国住宅代理:本地IP准确性对搜索引擎结果、广告和定价的重要性

freeCodeCamp.org
freeCodeCamp.org · 2026-04-14T18:19:42Z

欧盟计划将ChatGPT视为超大型搜索引擎,纳入数字服务法案的监管范围。ChatGPT在欧盟拥有超过1.2亿活跃用户,需遵守严格法律要求,改造推荐系统,以防止非法内容及对公众健康的影响。

欧盟决定将ChatGPT归类为大型搜索引擎 将按照数字服务法加强监管

蓝点网
蓝点网 · 2026-04-14T05:00:45Z

某电商平台的搜索系统从MySQL迁移到Elasticsearch,查询延迟从800ms降至15ms,但分片数激增至8000,导致超时率上升。文章探讨了生产级搜索系统的架构组件,强调倒排索引的重要性,并介绍了查询解析、分词、分布式索引等关键环节。还讨论了分片策略、相关性排序及Elasticsearch集群架构,指出运维挑战如分片膨胀和映射爆炸,最后提出了搜索系统的整体架构和优化策略。

【系统架构设计】搜索引擎架构:倒排索引之上的系统设计

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z
带着鸭鸭和狗狗逃离咕噜咕噜

文章探讨了搜索引擎的发展及其对隐私的影响。从早期的Archie和Gopher演变至现代的Google和Bing。尽管DuckDuckGo宣称保护隐私,但仍依赖广告盈利。Kagi作为付费搜索引擎,注重用户体验和隐私。作者认为没有完美的搜索引擎,用户需根据需求进行选择。

带着鸭鸭和狗狗逃离咕噜咕噜

極客死亡計劃
極客死亡計劃 · 2026-04-01T15:01:05Z
pg_textsearch 1.0:我们如何在Postgres页面上构建BM25搜索引擎

pg_textsearch是基于Postgres的BM25索引扩展,提供高效的全文搜索。它通过内存中的反向索引和块最大WAND算法优化查询速度,支持快速排名和并行构建索引。与ParadeDB相比,pg_textsearch在短查询上表现更佳,索引大小更小,但不支持短语查询和模糊匹配。

pg_textsearch 1.0:我们如何在Postgres页面上构建BM25搜索引擎

Timescale Blog
Timescale Blog · 2026-03-31T13:09:03Z

近年来,我的博客更新频率低,因技术问题感到疲惫。最近通过AI修复了这些问题,意识到AI可能取代搜索引擎。尝试重新使用AdSense却因内容被判定为低价值未通过审核,反思个人博客在信息时代的未来。

折腾了十年,我的博客被判定为“低价值”

君子不器
君子不器 · 2026-03-29T04:28:30Z

谷歌致力于支持英国竞争与市场管理局的数字市场新规,强调搜索结果的公平性,反对无证据的第三方提案,认为这会影响用户体验。建议在设备设置中提供简单的默认搜索引擎切换选项,并增强网站所有者对内容使用的控制。谷歌将继续与CMA合作,寻求有利于用户和出版商的解决方案。

谷歌对CMA关于搜索潜在要求的咨询回应

The Keyword
The Keyword · 2026-03-18T12:50:00Z
什么是专业搜索引擎,它们为何重要?

专业搜索引擎专注于特定领域,如学术研究、招聘和医疗,提供更相关的搜索结果。与通用搜索引擎不同,它们使用定制的过滤工具和排名系统,确保信息的可信度和准确性。用户可以根据需求选择合适的专业搜索引擎,以获得更精准的搜索体验。

什么是专业搜索引擎,它们为何重要?

meilisearch blog
meilisearch blog · 2026-03-03T00:00:00Z

由于百度爬虫无节制抓取博客园,导致其流量被封杀,博客园面临生存困境,原创内容质量下降,内容生态受到冲击,提醒程序员关注优质技术内容。

百度为什么封杀博客园:一场技术社区与搜索引擎的流量战争

dotNET跨平台
dotNET跨平台 · 2026-02-24T00:01:38Z

文章探讨了与AI讨论游戏设计的体验,指出AI虽然能提供丰富信息,但缺乏独立思考,容易夸大其词。作者认为AI更像是高级搜索引擎,能帮助发现游戏,但不应完全依赖其设计建议。特别提到了一款名为dotAGE的游戏,强调其设计深度和挑战性。

和 AI 聊游戏设计

云风的 BLOG
云风的 BLOG · 2026-01-15T08:05:08Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码