谷歌的Gemini Diffusion模型利用扩散技术,在12秒内生成1万tokens,速度比传统模型快2000倍。该模型通过逐步优化噪声生成文本,支持非因果推理,提升生成质量和一致性。
本研究分析了基础模型在对抗输入下的脆弱性,评估了扩散去噪平滑技术的效果。结果表明,高噪声扩散显著降低模型性能,而低噪声设置则保护不足。此外,提出了一种新攻击策略,揭示了鲁棒性与性能之间的权衡。
We’re always working on new approaches to improve our models, including making them more efficient and performant. Our latest research model, Gemini Diffusion, is a stat…
本研究提出RefiDiff框架,针对高维混合数据集中的非随机缺失值插补问题。该框架结合局部机器学习与去噪网络,显著提升性能和准确性,训练速度提高4倍,展现出优越的鲁棒性和可扩展性。
本研究分析了7种基于扩散的生成文本到音频模型的能耗与环境影响,提出了性能与能耗的平衡方案,以提高生成音频模型的效率。
本研究提出了一种新型自监督图表示学习方法Graffe,旨在解决扩散概率模型在图表示学习中的应用不足。该模型通过图编码器提炼源图,并指导扩散解码器去噪,从而在节点和图分类任务中实现领先性能。
本研究提出了一种自我推测解码(ASD)方法,旨在解决去噪扩散概率模型(DDPMs)推理中的计算瓶颈,显著提高推理速度。ASD在并行运行时的速度比传统方法快约$ ilde{O}(K^{rac{1}{3}})$。
本研究提出了一种新的“文本到序列(T2S)”扩散框架,旨在解决时间序列生成中的数据稀疏性、失衡及多模态数据集有限性问题。T2S通过分类时间序列描述并引入高分辨率数据集,能够生成任意长度的时间序列,具有广泛的实际应用潜力。
本研究提出了一种T2ID-CAS方法,以解决颈部超声解剖标志检测中的类别不平衡问题。该方法结合了潜在扩散模型和分类意识采样,实验结果显示平均精确度达到88.2%,显著高于基线的66%,展现了在超声引导干预中的应用潜力。
本研究提出了Diffleop模型,针对深度学习三维生成模型在优化过程中未充分考虑蛋白-配体结合亲和力的问题。结果表明,Diffleop在多个指标上优于基线模型,尤其在结合亲和力方面表现突出。
本研究提出OmegAMP框架,旨在解决深度学习在抗菌肽发现中的低命中率和可控性差的问题,通过生成模型和低维嵌入技术,提高抗菌药物抗性研究的效率。
本研究针对自主车辆在识别稀有故障模式时的挑战,提出利用生成和可解释的人工智能技术,生成多样化的环境图像和自然语言描述,以提高AV系统的安全性和可靠性。
本文提出了一种高效的伴随采样算法,旨在从非标准密度中进行扩散过程的采样,支持大规模学习,尤其在计算化学领域具有重要影响。
Diffusion Language Models (DLMs) have emerged as a promising new paradigm for text generative modeling, potentially addressing limitations of autoregressive (AR) models. However, current DLMs have...
本研究提出了一种基于ODE的增强采样方法RX-DPM,旨在降低扩散概率模型生成高质量样本的计算成本,同时显著提升样本估计精度和采样效率。
本研究提出了一种新的双曲面扩散推荐模型(HDRM),旨在克服扩散模型在推荐系统中的局限性,尤其是在处理物品的各向异性和方向性结构方面。实验结果表明,该模型在多个数据集上显著提高了推荐性能。
完成下面两步后,将自动完成登录并继续当前操作。