小红花·文摘

一文吃透Ollama Embeddings：概念、实操、避坑，助力RAG落地｜本地部署AI大模型必备

人言兑 ·

本研究提出了一种名为MultiActor-Audiobook的零样本有声书生成方法，能够自动生成具有一致性和表现力的语调与情感，无需额外训练，从而提升有声书的情感表现力。

Multi-Actor Audiobook: Zero-Shot Audiobook Generation Based on Multiple Speakers

BriefGPT - AI 论文速递 ·

本文综述了不可学习数据（ULD）作为新兴防御技术，分析了生成方法和评估指标，强调了可学习性、隐匿性、效率与鲁棒性之间的权衡，并指出未来研究方向及其在机器学习数据保护中的潜力。

A Review of Unlearnable Data

BriefGPT - AI 论文速递 ·

本研究提出了一种超图检索增强生成方法（HyperGraphRAG），旨在解决传统图方法在处理多元关系时的局限性。通过超边表示多个实体间的复杂关系，实验结果表明该方法在准确度和生成质量上优于现有技术。

Hypergraph Retrieval-Augmented Generation: Knowledge Representation Based on Hypergraph Structure

BriefGPT - AI 论文速递 ·

本研究提出了一种高效生成广阔户外场景的方法，通过将场景块编码为统一向量集，提高了生成的一致性和速度，并展示了在不同风格场景中融合的潜力。

NuiScene: Exploring Efficient Generation of Unbounded Outdoor Scenes

BriefGPT - AI 论文速递 ·

本研究提出了一种基于长短期记忆神经网络的生成方法，能够有效模拟人类运动行为，优于现有模型，具有广泛的应用潜力。

Personalized Data-Driven Human Motion Generation Model

BriefGPT - AI 论文速递 ·

本文提出了一种基于多模态大型语言模型的广告图像生成方法，旨在提高点击率（CTR）。通过预训练和强化学习，模型生成与商品特征一致且吸引用户的广告图像。实验结果表明，该方法在CTR预测和生成效果上优于现有技术，显著提升了广告效果。

【前瞻技术布局】京东零售广告创意：引入场域目标的创意图片生成

京东科技开发者 ·

本研究提出了一种基于人体对齐的3D可穿戴资产生成方法（BAG），有效解决了现有模型在自动生成可穿戴3D资产方面的不足。该方法利用人体形状和姿势信息控制生成过程，实验结果表明其在形状多样性和质量上优于现有技术。

基于人体对齐的3D可穿戴资产生成

BriefGPT - AI 论文速递 ·

LightRAG 源码简要分享

Measure Zero ·

本研究探讨了生成方法在环境音频零样本学习中的应用，采用新型扩散模型显著提高了分类准确率，为该领域提供了新的前景和基准。

扩散模型在环境音频零样本学习中的应用

BriefGPT - AI 论文速递 ·

本研究提出了一种新的少监督视频字幕生成方法，结合伪标记和关键词精炼模块，显著减少了对大量标注句子的依赖。实验结果显示，该方法在少监督和全监督场景下均表现出明显优势。

Pseudo-labeling and Keyword Refining for Few-Supervised Video Captioning

BriefGPT - AI 论文速递 ·

本研究分析大型语言模型在人类价值对齐中的不足，提出一种从弱到强的生成方法，实验证明其在安全性、毒性和法律推理等任务中有效提升模型输出质量和对齐性能。

超越准确性的弱到强泛化：安全性、毒性和法律推理的初步研究

BriefGPT - AI 论文速递 ·

本文综述了318篇关于深度伪造生成与检测的研究，分析了生成方法和检测技术，探讨了深度伪造对安全和隐私的威胁，提出了新型检测方法和框架，强调高质量训练数据的重要性及未来研究方向。

震撼虚假：通过主动探测快速检测深度伪造视频

BriefGPT - AI 论文速递 ·

本文综述了基于扩散模型的时间序列预测与生成方法，介绍了TimeDiff、TEMPO、Timely Generative Pre-trained Transformer等新模型，强调了大规模预训练在时间序列分析中的重要性，并提出了TimeAutoDiff和TimeLDM等创新方法，展示了生成质量和性能的显著提升。

TimeDiT：用于时间序列的通用扩散变换器基础模型

BriefGPT - AI 论文速递 ·

研究表明，传统语言模型在代码生成方面存在困难，通过引入外部上下文信息（如库文档）可以改善效果。创建的CodeRAG-Bench评估基准显示，高质量的上下文能够提升代码生成效果，但在词汇重叠有限的情况下，检索器仍难以获取有用信息。希望该基准能促进检索增强生成方法的发展。

通过检索增强生成的少样本学习中的语言模型代码翻译

BriefGPT - AI 论文速递 ·

本文介绍了多种基于去噪扩散概率模型的生成和聚类方法，如TreeVAE、VaDE和ClavaDDPM。这些模型通过优化潜在表示和引入层次结构，显著提升了聚类和生成性能，尤其在生物医学图像和分子设计领域表现突出。

结构化生成：使用分层聚类引导扩散模型

BriefGPT - AI 论文速递 ·

本文介绍了CG-VLM、VaLM和TCL等视觉-语言模型的研究进展，强调通过对比学习和生成方法实现视觉与语言的有效对齐。这些模型在图像-文本检索和视觉问答等任务中表现优异，显著提升了常识推理和对齐准确性。

视觉对齐中的图像识别：优先考虑视觉相似性

BriefGPT - AI 论文速递 ·

本文提出了一种名为Instant3D的高效文本到3D生成方法，利用预训练的文本到图像扩散模型，在消费级显卡上仅需约8毫秒生成高质量、多样化的3D资产，显著提高了生成速度和视觉质量，无需3D训练数据。

Dual3D: 双模多视角潜在扩散下高效一致的文本到 3D 生成

BriefGPT - AI 论文速递 ·

本文介绍了多种新方法，如StableDreamer、BoostDream和DreamGaussian，以提高文本到3D生成的质量和效率。这些方法通过优化噪声水平、网络架构和模型表示，解决了模糊外观和几何不一致性的问题，实现了高保真3D模型的生成，显著改善了3D重建和资源生成的定量和定性效果。

MicroDreamer：基于得分的迭代重建，无需说明，在约 20 秒内进行零样本 3D 生成

BriefGPT - AI 论文速递 ·

本文综述了深度伪造技术的生成与检测方法，分析了其对社会的威胁及现有检测工具的局限性，强调了持续研究的重要性，以确保数字媒体的完整性，并探讨未来的研究方向和防御措施。

深伪和高等教育：综合媒体的研究议程和范围回顾

BriefGPT - AI 论文速递 ·