标签

 rag 

相关的文章:

本列表汇集了关于RAG技术及其在大语言模型中的应用的文章,涵盖从基础实现到优化策略的多种主题,助您深入了解这一前沿技术。

基于Cherry Studio实现DeepSeek大模型 + RAG知识库

原文中文,约1700字,阅读约需4分钟。发表于:

作者:厦门大学信息学院计算机科学系2023级研究生 黄万嘉 指导老师:厦门大学数据库实验室 林子雨 博士/副教 […]

Cherry Studio 是一款跨平台桌面客户端,集成300多个大语言模型,支持多种AI服务。其核心功能是通过外部知识库提升模型回答质量,适用于法律和医疗等领域。用户可实时更新数据,支持多种文件格式,快速检索信息。

基于Cherry Studio实现DeepSeek大模型 + RAG知识库
相关推荐 去reddit讨论
相关推荐 去reddit讨论

RAG簡介投影片:現況、原理、發展 / RAG Introduction Slides: Current Status, Mechanisms, and Development

原文中文,约2200字,阅读约需6分钟。发表于:

這份投影片對檢索生成增強(Retrieval-Augmented Generation, RAG)的觀念作一個容易理解的介紹,也是「資訊檢索的AI革新:從資訊檢索到檢索增強生成」這篇的簡化版本。一般說到AI大家都會想到創造力、彷彿真人的表現,但RAG本質上更接近資訊檢索的問題。把它當作資料庫就很容易理解RAG的用途了。 This presentation provides an...

这份幻灯片介绍了检索增强生成(RAG)技术,强调其在信息检索中的重要性。RAG通过外部数据库提升大型语言模型的准确性,并探讨其工作原理、发展方向及实际挑战。尽管RAG并非万能,但能有效利用数据,改善知识获取。

相关推荐 去reddit讨论

RAG在处理长上下文时真的表现不好么?

原文中文,约300字,阅读约需1分钟。发表于:

本研究针对大型语言模型在长上下文处理中的效率问题,提出了一种新的RAG框架RetroLM。与传统方法不同,RetroLM通过KV级别的检索增强技术,提高了对检索不准确的鲁棒性,并在多种基准测试中显著超越了现有的长上下文处理方法,尤其是在需要深度推理或极长上下文理解的任务中。

本研究提出了RetroLM框架,旨在提高大型语言模型在长上下文处理中的效率。该框架通过KV级别检索增强技术,增强了鲁棒性,并在多项基准测试中显著优于现有方法,尤其在深度推理和极长上下文理解任务中表现突出。

相关推荐 去reddit讨论

使用.NET摄取文档构建简单的检索增强生成(RAG)系统

原文英文,约1500词,阅读约需6分钟。发表于:

Here is a quick post summarising how to use .NET Semantic Kernel, Qdrant and .Net to ingest markdown documents. One of the comments a recent post related to the topic was about why using Python...

本文介绍了如何使用.NET Semantic Kernel和Qdrant处理Markdown文档,包括文档分割、生成嵌入和向量存储管理。示例中使用LangChain .NET进行文本分割,并展示了如何查看处理结果和指标。最终用户可通过Aspire Dashboard获取相关信息。

使用.NET摄取文档构建简单的检索增强生成(RAG)系统
相关推荐 去reddit讨论

R.I.P. RAG?Gemini Flash 2.0可能再次革命化AI——检索增强生成是否已过时?

原文英文,约1000词,阅读约需4分钟。发表于:

You clicked because you're in the AI trenches, right? You're wrestling with Large Language Models (LLMs), trying to make them actually useful for real-world applications. And chances are, you've...

Gemini Flash 2.0的推出可能使检索增强生成(RAG)技术变得过时。它提供了100万标记的巨大上下文窗口,简化了AI应用的复杂性,提高了效率和响应速度。尽管RAG在特定场景中仍有用,但Gemini Flash 2.0可能会重新定义AI的构建和部署方式。

R.I.P. RAG?Gemini Flash 2.0可能再次革命化AI——检索增强生成是否已过时?
相关推荐 去reddit讨论

使用免费大型语言模型的RAG

原文英文,约100词,阅读约需1分钟。发表于:

How to Create Your Own RAG with Free LLM Models and a Knowledge Base Alexander Uspenskiy ・ Dec 16 '24 #python #ai #rag #vectordatabase

抱歉,您提供的文本没有具体的文章内容。请提供详细信息,我将为您进行总结。

使用免费大型语言模型的RAG
相关推荐 去reddit讨论
相关推荐 去reddit讨论

雜談:我可以只要RAG的「R」嗎? / TALK: Can I Just Have the “R” in RAG?

原文中文,约2500字,阅读约需6分钟。发表于:

很多人以為RAG可以取代搜尋引擎,但其實很多人要的功能只有「能用自然語言檢索」而已。 RAG中的語意檢索 / Semantic Search in RAG RAG的全名「Retrieval-Augmented...

RAG(检索增强生成)并非真正的检索工具,其“R”部分依赖语义检索,导致搜索结果数量有限,通常仅为3到10条,且可能来自同一文档,这对研究者造成限制。微软的新AI搜索功能支持自然语言检索,标志着语义检索的普及。

相关推荐 去reddit讨论

优化大型语言模型的检索增强生成(RAG)

原文英文,约700词,阅读约需3分钟。发表于:

Introduction Retrieval-Augmented Generation (RAG) has emerged as a powerful paradigm for enhancing the capabilities of Large Language Models (LLMs) by combining information retrieval with...

检索增强生成(RAG)结合信息检索与文本生成,提升大型语言模型(LLM)的能力。RAG动态检索相关信息,适用于需要最新知识的任务。优化RAG面临延迟、检索相关性和计算成本等挑战。通过高效向量检索、混合检索、上下文窗口优化、缓存机制和微调等技术,可以提升RAG性能并降低成本。

优化大型语言模型的检索增强生成(RAG)
相关推荐 去reddit讨论