小红花·文摘

Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

Apple Machine Learning Research ·

本研究提出了一种复杂度注释的第一阶逻辑推理数据集，旨在提升大语言模型对复杂算法的理解能力。该数据集包含35亿个标记，促进对模型学习符号推理过程的深入研究，增强算法能力的透明性。

FOL-Pretraining: A Complexity Annotated Corpus of First-Order Logic

BriefGPT - AI 论文速递 ·

本研究提出了Endo-CLIP框架，旨在解决结肠镜图像分析中的背景干扰和医学术语模糊问题。实验结果表明，该框架在息肉检测与分类方面优于现有方法，准确性更高。

Endo-CLIP: A Stepwise Self-Supervised Pretraining on Raw Colonoscopy Records

BriefGPT - AI 论文速递 ·

本研究提出了一种心脏表型引导的生成模型（CPGG），旨在解决高质量心脏磁共振成像（CMR）数据集稀缺的问题。该模型通过两阶段生成，成功合成大量高质量CMR数据，显著提升了诊断性能和心脏表型预测能力。

Phenotype-Guided Generative Model for High-Fidelity Cardiac MRI Synthesis: Advancing Pretraining and Clinical Applications

BriefGPT - AI 论文速递 ·

本研究提出统一世界模型（UWM），通过结合视频和动作扩散，解决大规模机器人基础模型中模仿学习的扩展问题。UWM在统一变换器架构中整合这两种数据，显著提升了策略学习的通用性与鲁棒性。

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

BriefGPT - AI 论文速递 ·

本研究提出了一种名为SeLIP的对比学习框架，旨在解决医学图像分析中的标注数据不足问题。通过结合图像和放射学发现，增强了对比学习。实验结果表明，该模型在图像-文本检索、分类和图像分割等任务中表现优异，强调了文本相似性在医学图像基础模型构建中的重要性。

SeLIP: Similarity Enhanced Contrastive Language-Image Pretraining for Multi-modal Head MRI

BriefGPT - AI 论文速递 ·

本研究提出了TULIP模型，旨在改善现有图像-文本对比模型在视觉任务中的不足。通过数据增强和对比学习，TULIP能够更有效地学习细粒度视觉特征，并保持全局语义一致性。实验结果显示，TULIP在多个基准测试中超越了现有模型，尤其在零-shot任务和少量样本分类上表现显著提升。

Unified Language-Image Pretraining: TULIP

BriefGPT - AI 论文速递 ·

本研究提出EgoDTM模型，解决自我中心视频语言预训练中缺乏三维理解的问题。该模型结合大规模3D视频预训练与视频-文本对比学习，通过轻量级三维解码器高效学习三维感知。实验结果表明，EgoDTM在多项任务中表现优异，展现出卓越的3D视觉理解能力。

EgoDTM: Towards 3D-Aware Egocentric Video-Language Pretraining

BriefGPT - AI 论文速递 ·

本研究提出MASS框架，旨在解决大型语言模型预训练中的数据选择问题。该框架通过数学推理技能图有效捕捉数学技能及其关系，实验结果显示显著提升了模型的训练效率和效果。

A Mathematical Data Selection Framework Using Skill Graphs for Pretraining Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了SkyLadder上下文窗口调度策略，旨在提高LLM预训练中长上下文窗口的效率。实验结果显示，SkyLadder在基准测试中提升了模型性能，并提高了22%的训练速度，显著优化了预训练效率。

SkyLadder: Achieving Faster and Better Pretraining via Context Window Scheduling

BriefGPT - AI 论文速递 ·

本研究提出了一种去噪分数蒸馏（DSD）方法，旨在提升扩散模型在低质量数据下的生成性能。通过在噪声样本上预训练并蒸馏为一步生成器，DSD显著改善了生成样本的质量。

Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation

BriefGPT - AI 论文速递 ·

本研究提出了一种通用的超参数缩放法则，解决了大型语言模型的超参数优化问题。研究发现，最佳学习率与模型参数和数据规模呈幂律关系，而批次大小主要与数据规模相关。这为模型性能优化提供了有效工具。

Predictable Scaling: Part One - Optimal Hyperparameter Scaling Laws in Pretraining Large Language Models

BriefGPT - AI 论文速递 ·

GLM是一种通用语言模型，通过自回归填空预训练，结合2D位置编码和混合任务训练，提升了自然语言理解与生成的性能。实验表明，GLM在多个任务上优于BERT和T5，展现了其灵活性和可推广性。

论文分享：GLM: General Language Model Pretraining

京东科技开发者 ·

本研究提出了一种新型教师-学生多任务框架，以提高脓毒症死亡率预测的准确性。通过自监督预训练，该框架有效应对血管活性药物评分的动态变化和数据缺失问题，AUROC达到0.82，强调临床和社会因素在重症监护中的重要性，助力早期识别高风险患者。

A Novel Multi-Task Teacher-Student Architecture with Self-Supervised Pretraining for 48-Hour Vasoactive Drug Trend Analysis in Sepsis Mortality Prediction

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过引入归纳偏见来增强CLIP模型在复杂组合场景中的理解能力，提升多对象组合理解的性能。

Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

FOL-Pretraining: A Complexity Annotated Corpus of First-Order Logic

Endo-CLIP: A Stepwise Self-Supervised Pretraining on Raw Colonoscopy Records

Phenotype-Guided Generative Model for High-Fidelity Cardiac MRI Synthesis: Advancing Pretraining and Clinical Applications

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

SeLIP: Similarity Enhanced Contrastive Language-Image Pretraining for Multi-modal Head MRI

Unified Language-Image Pretraining: TULIP

EgoDTM: Towards 3D-Aware Egocentric Video-Language Pretraining

A Mathematical Data Selection Framework Using Skill Graphs for Pretraining Large Language Models

SkyLadder: Achieving Faster and Better Pretraining via Context Window Scheduling

Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation

Predictable Scaling: Part One - Optimal Hyperparameter Scaling Laws in Pretraining Large Language Models

论文分享：GLM: General Language Model Pretraining

A Novel Multi-Task Teacher-Student Architecture with Self-Supervised Pretraining for 48-Hour Vasoactive Drug Trend Analysis in Sepsis Mortality Prediction

Object-Centric Binding in Contrastive Language-Image Pretraining

The Emergence of Intuitive Physics Understanding under Self-Supervised Pretraining

Dynamic Loss-Based Sample Reweighting to Improve Pretraining of Large Language Models

Provable Ordering and Continuity in Vision-Language Pretraining for Generalizable Embodied Agents

Vision Transformer-based Dual-Stream Self-Supervised Pretraining Network for Retinal OCT Classification

Optimizing Pretraining Data Mixtures with LLM-Estimated Utility