小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Recraft图像模型现已上线AI Gateway

Recraft模型现已通过Vercel的AI Gateway提供,无需额外账户。V3和V2模型擅长生成真实感照片和复杂提示,支持长文本生成。使用时设置为'recraft/recraft-v3',AI Gateway提供统一API,便于调用和优化性能。

Recraft图像模型现已上线AI Gateway

Vercel News
Vercel News · 2026-01-19T13:00:00Z
FS-DFM:基于少步扩散语言模型的快速准确长文本生成

FS-DFM(Few-Step Discrete Flow-Matching)是一种高效的长文本生成模型,通过优化采样步骤数量,显著减少生成长序列的延迟。在语言建模基准测试中,使用8个采样步骤时,其困惑度与传统1024步模型相当,速度提高了128倍。

FS-DFM:基于少步扩散语言模型的快速准确长文本生成

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-13T00:00:00Z

香港大学、字节跳动Seed和复旦大学联合推出的Polaris方法,通过700步强化学习训练,使4B模型在数学推理能力上超越多款商业大模型,特别是在长文本生成方面表现突出。该方法强调动态调整训练数据和超参数,提升了模型的多样性和准确性。

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

量子位
量子位 · 2025-07-09T06:58:32Z

本研究提出了一种新方法,通过分析频域中的键值缓存能量分布,利用低频部分进行有效压缩,解决大型语言模型在长文本生成中的上下文窗口扩展问题。实验结果表明,该技术在长上下文任务中显著提高了效率和有效性。

FreqKV:用于高效上下文窗口扩展的频域键值压缩

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出MAMM-Refine方法,通过多智能体和多模型协作,提升长文本生成的可信度,尤其在总结和问答领域。研究表明,该方法有效消除事实不一致性,显著提高生成内容的准确性和整体性能。

MAMM-Refine: A Multi-Agent Collaboration Paradigm for Enhancing Generation Credibility

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究针对长文本生成中的“失落中间”问题,提出了长输入输出基准(LongInOutBench)和合成数据集,开发了检索增强长文本生成器(RAL-Writer),显著提升了长输入和长输出任务的生成效果。

The 'Lost-in-the-Middle' Problem in Long-Text Generation: Synthetic Datasets, Evaluation Frameworks, and Mitigation Strategies

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究强调在小说创作和复杂推理中对连贯逻辑长文本的需求,建议将长文本生成的重点从长输入处理转向长输出生成,并呼吁开发高质量长文本输出的基础性大型语言模型。

将长文本上下文的研究从输入转向输出

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究提出Qwen2.5系列模型,以解决大型语言模型在多样化需求上的不足。通过扩大预训练数据集和多阶段强化学习,显著提升了长文本生成、结构数据分析和指令遵循的能力。

Qwen2.5 Technical Report

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究提出段级扩散(SLD)框架,旨在解决扩散模型在生成长文本时的连贯性和上下文准确性问题。通过文本分段和对抗学习,SLD显著提升了生成效果,实验结果显示其在流畅性和连贯性方面优于其他方法。

Segment-Level Diffusion: A Framework for Controllable Long-Form Generation with Diffusion Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-15T00:00:00Z

本研究提出了DAHL,一个用于评估生物医学长文本生成中幻觉现象的基准数据集和自动评估系统。通过分析8573个问题,发现较大模型通常幻觉较少,并提出DAHL分数作为更高效的评估替代方案。

DAHL:针对生物医学领域长文本生成的领域特定自动化幻觉评估基准数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究提出了一种图形不确定性方法,旨在解决大型语言模型在长文本生成中的虚构和不确定性问题。通过二分图表示生成与声明的关系,结果显示该方法在多个任务上提高了6.8%的AUPRC,并在事实性方面改善了2-4%。

基于图的长文本语言模型输出的不确定性度量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本研究提出UncertaintyRAG方法,通过信噪比评估文本片段相似性,解决长文本生成中的不一致性问题。该方法提高了模型的校准和稳健性,在相同数据量下超越基线,展现出强大的泛化能力和灵活性。

不确定性增强的长文本建模用于检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

该研究提出了一种新方法,解决大型语言模型生成文本时的高计算成本和输出分布扭曲问题。该方法提高了计算效率,保持输出分布平衡,并能在困难约束下生成长文本,性能与不扭曲分布的方法相当。

Approximate Alignment Decoding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-01T00:00:00Z
Qwen2.5: 基础模型大派对!

Qwen2.5是最新发布的语言模型,专注于编程和数学,具有显著的知识、编程和数学能力提升,支持多种语言,适应性强。该模型在长文本生成和结构化数据理解方面表现优异,适合多种应用场景。

Qwen2.5: 基础模型大派对!

Blog on Qwen
Blog on Qwen · 2024-09-18T16:00:04Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码