UltraRAG是一个基于模型上下文协议(MCP)架构的低代码检索增强生成框架,提供可视化开发工具,支持模块化的检索、生成和评估,适用于RAG研究、企业文档问答和知识检索系统。
剑桥大学与Meta合作开发了全原子扩散Transformer(ADiT),该框架能够同时生成周期性材料和非周期性分子。实验结果表明,ADiT的性能与专用模型相当,显示出在生成复杂原子结构方面的有效性。
本研究提出了一种名为GETER的结构感知生成框架,旨在提升大型语言模型在时态推理中的可解释性。通过广泛的基准评估,实验结果表明该框架在性能和泛化能力上表现优异。
本研究提出了一种基于有限状态机和大型语言模型的智能合约生成框架(FSM-SCG),有效解决了传统生成方法的低效率和高门槛问题。实验结果显示,该框架生成的合约代码编译成功率提高了最多48%,漏洞风险评分降低了约68%。
本研究提出了DRAGON分布式检索增强生成框架,旨在提升小型语言模型在资源受限边缘设备上的推理性能。通过整合通用和个人知识,DRAGON显著提高了模型性能,降低了延迟,并提升了生成效率,同时保护文档隐私。
本研究探讨了在隐私限制下,日本医学问答中基于知识图谱的检索增强生成框架(KG-based RAG)的有效性。结果表明,KG-based RAG对小规模开源LLMs的影响有限,效果依赖于外部检索内容的质量和相关性。
本文提出了一种新颖的多模态检索增强生成框架MMKB-RAG,旨在解决大型语言模型在生成最新信息时的局限性和准确性风险。实验结果表明,该方法在视觉问答任务中显著提升了性能和鲁棒性。
本研究提出了一种新的遥感检索增强生成框架(RS-RAG),并构建了包含高分辨率卫星图像及详细文本描述的多模态知识数据集(RSWK)。该框架在图像描述、分类和视觉问答等任务上显著优于现有基线,推动了遥感领域与更广泛知识的结合。
本研究提出了StageDesigner,这是首个综合大型语言模型与布局控制的扩散模型的舞台艺术生成框架,能够模拟艺术家工作流程,生成沉浸式3D舞台场景,展现出显著的应用潜力。
本研究提出了一种基于加权检索增强生成框架的代理人工智能解决方案,用于企业系统的技术故障排除。该框架通过动态加权不同数据源,提高了故障排除的精度和响应速度,初步评估显示其在解决技术挑战方面表现优异,未来将整合对话式人工智能能力,提升用户体验。
本研究提出了一种“智能体的房间”生成框架,旨在解决大型语言模型在创作复杂小说时的局限性。通过将叙事写作拆解为多个子任务,由专业智能体协作完成,生成的故事在专家评估中表现优于基线系统,展现出更高的故事质量和可用性。
本文介绍了人体运动生成领域的最新研究进展,重点讨论了基于扩散模型的生成框架,如Motion Diffusion Model和VLOGGER,及其在生成高质量舞蹈视频和复杂运动中的应用潜力。同时,探讨了评估指标、数据集及未来研究方向。
本文提出了一种迭代检索-生成框架,以提升大型语言模型的推理能力。实验结果显示,该方法在多跳问答任务中显著优于传统模型。研究探讨了如何结合检索段落与语言模型,提高答案生成的准确性和可解释性,并提出多种改进技术以增强检索质量和效率。
本文介绍了多种基于文本和图像的生成框架,旨在实现高质量的3D服装和人像图像合成。这些方法结合了GPT架构、注意力机制和扩散模型,在渲染质量和多样性上优于现有技术,展示了实际应用的潜力。
T2M-HiFiGPT是一种新型条件生成框架,能够生成人体动作。它基于RVQ-VAE和双层GPT结构,研究表明RVQ-VAE能够产生高精度的2D时间-残差离散动作表示。双层GPT结构能够将先前帧和文本描述的信息压缩成1D上下文向量,并通过RVQ-VAE解码器将生成的残差离散指标转化回动作数据。该框架在HumanML3D和KIT-ML数据集上表现出色,优于最新的基于扩散和GPT的方法。
本研究提出了一种基于级联扩散的生成框架,用于文本驱动的人体动作合成。该框架利用了一种名为GUESS的策略,将人体姿态逐步抽象为多个粒度级别上的更粗糙的骨架,从而改善了跨模态动作合成任务。实验证明,GUESS优于现有方法。
介绍了一种基于概率扩散模型的生成框架,用于多样化生成时空湍流。该方法适应各种条件情景,具有长时跨度流动序列生成的能力。通过实验展示了该框架在湍流生成领域的优点和潜力。
DiffuseVAE是一种新的生成框架,将VAE与扩散建模框架相结合,提供低维的VAE学习到的潜在代码,用于控制合成等下游任务。该模型速度和质量平衡更好,具有泛化能力,综合质量与最先进的模型可比。
完成下面两步后,将自动完成登录并继续当前操作。