小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Google NotebookLM 更新为全面的研究与内容生产环境,新增精准幻灯片修订、PPTX 导出、自动视频概述、直接聊天生成文档及支持 EPUB 的长文档处理功能,提升信息整合效率与工作流程。

高级 NotebookLM 使用技巧与窍门

KDnuggets
KDnuggets · 2026-04-10T14:00:06Z
星河社区PaddleOCR焕新升级:异步服务、千页解析,批量处理,一次满足!

PaddleOCR官网更新,提升每日免费解析额度至1万页,新增异步服务以提高长文档解析效率,单文件支持上限提升至1000页,底层架构升级增强并发处理能力,旨在降低技术门槛,满足用户需求,推动AI技术普惠化。

星河社区PaddleOCR焕新升级:异步服务、千页解析,批量处理,一次满足!

百度大脑
百度大脑 · 2026-03-13T11:31:41Z
介绍 voyage-context-3:聚焦块级细节与全局文档上下文

voyage-context-3是一种新型上下文化块嵌入模型,能够在无需手动元数据的情况下捕捉文档完整上下文。与传统模型相比,它在块级和文档级检索任务中表现更优,提升了检索准确性并降低存储成本。该模型简化了技术架构,支持多维度和量化选项,适用于长文档和高敏感度检索任务。

介绍 voyage-context-3:聚焦块级细节与全局文档上下文

MongoDB
MongoDB · 2025-07-23T18:47:00Z
介绍 voyage-context-3:全球文档上下文下的聚焦块级细节

我们推出了voyage-context-3模型,通过上下文化的块嵌入提升文档检索的准确性。在块级和文档级检索任务中,分别比OpenAI-v3-large和Cohere-v4提高了14.24%和12.56%。该模型简化了技术堆栈,降低了存储成本,支持多维度和量化选项,适用于长文档和高敏感度检索任务。

介绍 voyage-context-3:全球文档上下文下的聚焦块级细节

Voyage AI
Voyage AI · 2025-07-23T12:40:17Z

语义分块RAG方法通过计算句子间的语义相似度进行智能分块,提升检索精度。该方法利用百分位数等技术找到语义断点,将文本分割成连贯块,适用于长文档处理和复杂问答系统。

RAG系列-语义分块RAG(Semantic Chunking RAG)

Ethan's Blog
Ethan's Blog · 2025-06-17T16:00:00Z
新项目:Markdown 目录生成器 📑

这篇文章介绍了一款Markdown目录生成器,能够自动生成文档目录。用户可自定义目录标题、编号样式和格式(HTML或Markdown),并可添加“返回顶部”链接。该工具提升了文档的可导航性,操作简单,适合长文档使用。

新项目:Markdown 目录生成器 📑

DEV Community
DEV Community · 2025-05-18T08:52:04Z

本研究提出了帧选择增强生成(FRAG)方法,旨在提高长视频和长文档的理解能力。FRAG通过独立评估每帧的相关性,能够在无需处理长上下文的情况下生成输出,从而显著提升现有多模态模型的表现。

FRAG: Frame Selection Augmented Generation for Long Video and Long Document Understanding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z
人工智能突破:新方法使模型更好地理解长文档,像人类一样

该研究提出了一种监督链式推理方法,以提升AI模型对长文档的理解能力。通过专门的训练数据和逻辑推理链,测试结果显示其在长文档理解任务中的表现更佳。

人工智能突破:新方法使模型更好地理解长文档,像人类一样

DEV Community
DEV Community · 2025-02-20T07:17:21Z
Using AI to Summarize Long Documents

本文探讨了如何利用AI进行长文档的摘要,特别是超出大型语言模型上下文窗口的情况。作者开发了名为summarize.wtf的应用,支持用户上传多种格式的文档并生成不同长度的摘要。通过将文档分段、生成向量嵌入并结合K-means聚类,提取关键主题,从而实现高质量摘要。这种方法在成本和效率上具有优势,适用于各种长度的文档。

Using AI to Summarize Long Documents

DemoChen's Clip
DemoChen's Clip · 2025-02-19T09:55:29Z

本研究提出了一种框架,通过话语分析将长文档分解为片段,从而有效解决了长文档摘要中的事实不一致性检测问题,显著提升了摘要质量。

Discourse-Based Evaluation: Unveiling Factual Inconsistencies in Long Document Summarization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究提出NExtLong框架,旨在解决大语言模型在长上下文训练中对长文档的处理不足。通过负文档扩展和抽取硬负样本,增强模型对长距离依赖性的建模能力。实验结果表明,该框架在相关基准测试中显著提升了性能。

Toward Effective Long-Context Training without Long Documents

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

LongDocURL是一个新基准,评估多模态长文档理解能力,涵盖理解、推理和定位等20个任务。GPT-4o得分64.5,仅刚及格,显示出当前模型在处理复杂文档时的挑战。该基准强调长文档的结构解析,推动文档理解的发展。

多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格

量子位
量子位 · 2025-01-03T06:46:43Z

本研究提出了LongKey框架,旨在解决现有关键词提取方法在长文档中的不足。LongKey通过编码器语言模型和最大池化嵌入,表现优于现有技术。

Keyword Extraction for Long Documents: LongKey

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究提出了一种新的块表示方法ChuLo,解决Transformer模型在处理长文档时的信息损失和计算限制问题。ChuLo通过无监督提取关键信息,将输入令牌分组,保留文档核心内容,提高处理效率。实验结果表明,该方法在长文档分类和令牌分类任务上效果显著。

ChuLo: A Block-Level Key Information Representation for Long Document Processing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

本文介绍了一种新方法FActScore,用于评估生成文本的真实性。该方法通过将文本分解为原子事实,并计算可靠来源支持的事实比例来进行评估。同时,研究提出了LongDocFACTScore框架,能够有效评估长文档的事实一致性,且在与人工测量对比中表现优于现有标准。此外,研究还指出大型语言模型在生成文本时存在的事实准确性问题,并提出D-FActScore以改善评估效果。

VERISCORE:评估长文生成的可验证主张的真实性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z
BGE M3-Embedding 模型介绍 - JadePeng

BGE M3-Embedding是由BAAI和中国科学技术大学开发的开源模型,支持100多种语言,最大输入长度为8192。该模型结合稠密、稀疏和多向量检索技术,显著提升信息检索效果,尤其在多语言和长文档检索中表现优异,特别是在跨语言任务中。

BGE M3-Embedding 模型介绍 - JadePeng

博客园 - JadePeng
博客园 - JadePeng · 2024-04-18T07:05:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码