小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了现代GBERT系列德国编码器模型,旨在满足资源有限时对编码器模型的需求。该模型在自然语言理解、文本嵌入和长上下文推理任务上表现优异,推动了德国NLP生态系统的发展。

Modern GBERT: German Independent Encoder Model Trained from Scratch

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本文提出了MLRBench,一个新的多语言长上下文推理基准,旨在克服现有基准的局限性。研究表明,高资源语言与低资源语言之间存在显著差距,且大型语言模型在多语言环境中有效利用的上下文长度不足30%。

Can Large Language Models Reason Over Extended Multilingual Contexts? Long-Context Evaluation Beyond Retrieval and Information Stacks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本文探讨了大型语言模型(LLMs)在长上下文推理中的挑战,并提出了一种后训练合成数据生成策略,以扩展LLMs的上下文窗口。研究表明,该模型在高达100万标记的上下文长度下表现良好,同时在通用语言任务中保持稳定性能。

通过层次合成数据生成将指令调优的LLM扩展到百万标记上下文

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

InftyThink方法通过将推理转变为迭代过程,突破了大语言模型在长上下文推理中的计算复杂性和性能限制,实现了无限推理深度和有限计算成本。实验结果表明,该方法在多个基准测试中提升了性能并降低了计算开销。

InftyThink: Breaking the Length Limits of Long-Context Reasoning in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-09T00:00:00Z

本研究提出APB框架,通过在GPU之间传递压缩上下文块,解决大型语言模型长上下文推理的效率瓶颈。该框架优化了计算和并行性,显著提升了预填充速度,同时保持了任务性能。

APB: Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks across GPUs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码