小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
如何使用RAG、ChromaDB和记忆构建一个AI驱动的私人文档搜索应用

文章讨论了如何使用LangChain和ChromaDB构建基于大语言模型的问答应用,重点在于处理非结构化数据,利用向量数据库进行信息存储和检索。通过数据加载、分块和相似性排名等步骤,开发者可以创建具有记忆功能的复杂应用,提高信息检索的准确性和效率。

如何使用RAG、ChromaDB和记忆构建一个AI驱动的私人文档搜索应用

The New Stack
The New Stack · 2026-04-10T16:00:00Z
主机数据迁移中选择ETL的五个错误理由

ELT是一种数据集成过程,将原始数据从源服务器传输到目标服务器上的数据系统,然后准备信息以供下游使用。相比之下,ETL过于复杂、劳动密集、成本高,不适合处理非结构化数据,也容易成为功能和计算瓶颈。ELT更加灵活,适合处理大量数据,特别是在云端和数据湖中进行分析,正在成为IT组织实现现代化和最大化现有投资价值的关键工具。

主机数据迁移中选择ETL的五个错误理由

BMC Software | Blogs
BMC Software | Blogs · 2026-03-30T13:51:33Z
结构化数据与非结构化数据

结构化数据和非结构化数据是现代组织的重要资产。结构化数据具有固定模式,便于分析,常用于财务和客户关系管理。非结构化数据缺乏预定义结构,分析难度大,但能提供市场趋势和客户情感的洞察。通过机器学习和自然语言处理等技术,可以从非结构化数据中提取有价值的信息,帮助企业优化决策和提升客户体验。

结构化数据与非结构化数据

Databricks
Databricks · 2026-02-11T14:34:53Z
基于DWS的向量计算功能实现简单的商品搜索推荐系统

本文介绍了DWS通过集成pgvector插件,实现高维向量数据检索,解决传统数据库在处理非结构化数据时的局限,提升商品推荐系统的语义搜索与相似度计算能力。

基于DWS的向量计算功能实现简单的商品搜索推荐系统

华为云官方博客
华为云官方博客 · 2026-02-10T02:54:51Z
Claude Opus 4.5 已上线

Databricks通过Claude Opus 4.5和Claude Sonnet 4.5加速数据工程转型,提升企业处理海量数据的能力,支持复杂任务和财务分析,简化数据治理,助力将非结构化数据转化为可操作智能。

Claude Opus 4.5 已上线

Databricks
Databricks · 2025-11-24T19:00:29Z
在AI时代重新定义数据仓库:Azure Databricks的应用

传统数据仓库适合结构化工作负载,但企业面临流数据和非结构化数据的挑战。Azure Databricks结合数据仓库的可靠性与湖仓的开放性,提供一个集成平台,支持分析、治理和AI。Unity Catalog集中管理权限和元数据,确保数据准确性和可追溯性,而Lakeflow则提升数据管道管理的性能和信任。

在AI时代重新定义数据仓库:Azure Databricks的应用

Databricks
Databricks · 2025-11-21T08:10:00Z
通过GPU加速的AI存储提供企业AI准备数据

AI数据平台将非结构化数据转化为可供企业AI代理使用的准备数据,以实现商业价值。尽管AI代理能够自动化复杂任务,但在生产中仍面临数据可用性和质量的挑战。非结构化数据占组织数据的70%至90%,治理难度较大。AI数据平台通过GPU加速快速、安全地处理数据,简化数据治理,提高数据安全性,帮助企业更好地利用AI投资。

通过GPU加速的AI存储提供企业AI准备数据

NVIDIA Blog
NVIDIA Blog · 2025-11-18T16:00:34Z

Zleap的SAG技术结合SQL与向量检索,提升了AI搜索的效率与准确性,能够将非结构化数据转化为结构化数据,广泛应用于企业决策和个人知识管理,推动AI行业发展。

Zleap技术解密:后RAG时代已来,SAG重新定义AI搜索

量子位
量子位 · 2025-11-18T03:17:48Z
PDF文档转化为生产环境:在Databricks上发布先进的文档智能技术

Databricks推出了ai_parse_document工具,解决企业在扩展AI代理时的非结构化数据访问问题。该工具通过单一SQL命令将PDF等文档转化为结构化数据,保留布局、表格和图像信息,从而简化数据处理流程,提高效率。

PDF文档转化为生产环境:在Databricks上发布先进的文档智能技术

Databricks
Databricks · 2025-11-11T16:00:02Z
预算有限,效率拉满:为什么 Kilo Code 成了我的首选 Coding Agent

Kilo Code 是一款出色的 AI 编程助手,支持多种模型,显著提升编程效率,尤其在处理非结构化数据方面表现优异。其任务清单功能和 Orchestrator 模式使复杂任务管理更加高效,适合开发者使用。

预算有限,效率拉满:为什么 Kilo Code 成了我的首选 Coding Agent

乱世浮生
乱世浮生 · 2025-08-29T00:09:55Z
通过Docling将非结构化数据转化为适合RAG的格式

检索增强生成(RAG)是一种提高大型语言模型(LLM)生成内容准确性的方法。RAG需要合适的数据架构以有效扩展,组织非结构化数据并提取有意义的见解以改善客户服务是主要挑战。Docling是一个开源工具,能够将多种文档格式转换为可用格式,简化数据处理流程,支持RAG工作流。

通过Docling将非结构化数据转化为适合RAG的格式

The New Stack
The New Stack · 2025-08-21T13:00:09Z
基于人工智能的数据治理与合规最佳实践

人工智能正在改变数据治理,帮助企业高效合规并减少手动任务。许多组织利用AI应对数据管理和合规挑战,尤其是非结构化数据的处理。AI能够自动分类信息、提供安全控制并降低合规风险,通过风险评估帮助企业早期识别潜在风险,提升治理效率。AI将成为企业数据增长中的重要合作伙伴。

基于人工智能的数据治理与合规最佳实践

KDnuggets
KDnuggets · 2025-08-11T17:00:46Z
使用 RAGFlow 搭建一套 AI 客服知识库

RAGFlow是一款开源RAG引擎,旨在高效处理非结构化数据。它利用深度文档理解技术解析文档并生成准确回答,适合客服优化。使用时需对知识库进行专业调优,以提升对话准确性。

使用 RAGFlow 搭建一套 AI 客服知识库

开源实验室
开源实验室 · 2025-08-04T00:00:00Z
通过将数据视为产品解锁创新的8种方法

许多传统数据系统无法满足现代AI工作负载的需求。成功的组织将数据视为产品,进行有效管理,包括命名、版本控制和文档记录。数据产品需支持关键业务功能,并通过标准化API与AI系统连接。企业应投资新兴数据源,处理非结构化数据,确保数据的可追溯性、合规性和可解释性,以提升数据价值。

通过将数据视为产品解锁创新的8种方法

The New Stack
The New Stack · 2025-07-30T16:00:35Z
决策树不仅适用于表格数据

决策树不仅适用于表格数据,还能处理文本、图像和时间序列等非结构化数据。通过适当的预处理技术,这些数据可以转化为结构化形式,供决策树模型使用。文章探讨了决策树的灵活性及其在多种数据格式中的应用,强调了其在机器学习中的重要性。

决策树不仅适用于表格数据

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-10T09:57:51Z
MCP是否会取代向量搜索?

模型上下文协议(MCP)为数据和SaaS所有者提供统一接口,支持代理实时访问外部数据源。尽管MCP在结构化数据查询中表现良好,但对于90%的非结构化数据,仍需高质量文档智能层进行预处理和索引。结合传统检索方法,MCP能更有效处理复杂查询和实时数据。

MCP是否会取代向量搜索?

Blog on LlamaIndex
Blog on LlamaIndex · 2025-06-18T00:00:00Z
多模态数据分析实用指南

BigQuery引入ObjectRef,解决结构化与非结构化数据分析问题。ObjectRef指向Google Cloud Storage中的非结构化数据,支持多模态数据集的创建与查询。用户可通过Python和SQL高效分析数据,打破数据孤岛,实现全面洞察。

多模态数据分析实用指南

KDnuggets
KDnuggets · 2025-06-17T17:00:08Z
Databricks推出Agent Bricks,新的无代码AI代理构建工具

Databricks推出Agent Bricks,简化AI代理构建。用户只需提供高层描述,系统自动生成代理,专注于从非结构化数据中提取信息,旨在降低成本、提高质量,帮助企业快速部署AI代理。

Databricks推出Agent Bricks,新的无代码AI代理构建工具

The New Stack
The New Stack · 2025-06-11T14:00:08Z
利用人工智能帮助机器理解视觉内容

Coactive公司利用人工智能平台分析视觉数据,帮助企业快速决策。创始人Coleman和Gaviria Rojas指出,未来企业将面临大量非结构化数据,AI将是关键。Coactive已与多家媒体和零售公司合作,提升内容管理效率和人机互动。

利用人工智能帮助机器理解视觉内容

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-06-09T19:45:00Z
宣布针对向量搜索的存储优化端点

企业面临大量非结构化数据,AI应用如向量搜索引擎可提升数据处理效率。新功能支持数十亿向量,成本降低7倍,索引速度提升20倍,并提供SQL样式过滤,便于开发和管理。

宣布针对向量搜索的存储优化端点

Databricks
Databricks · 2025-06-06T16:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码