小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种复杂度注释的第一阶逻辑推理数据集,旨在提升大语言模型对复杂算法的理解能力。该数据集包含35亿个标记,促进对模型学习符号推理过程的深入研究,增强算法能力的透明性。

FOL-Pretraining: A Complexity Annotated Corpus of First-Order Logic

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了Endo-CLIP框架,旨在解决结肠镜图像分析中的背景干扰和医学术语模糊问题。实验结果表明,该框架在息肉检测与分类方面优于现有方法,准确性更高。

Endo-CLIP: A Stepwise Self-Supervised Pretraining on Raw Colonoscopy Records

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本研究提出了一种心脏表型引导的生成模型(CPGG),旨在解决高质量心脏磁共振成像(CMR)数据集稀缺的问题。该模型通过两阶段生成,成功合成大量高质量CMR数据,显著提升了诊断性能和心脏表型预测能力。

Phenotype-Guided Generative Model for High-Fidelity Cardiac MRI Synthesis: Advancing Pretraining and Clinical Applications

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本研究提出统一世界模型(UWM),通过结合视频和动作扩散,解决大规模机器人基础模型中模仿学习的扩展问题。UWM在统一变换器架构中整合这两种数据,显著提升了策略学习的通用性与鲁棒性。

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-03T00:00:00Z

本研究提出了一种名为SeLIP的对比学习框架,旨在解决医学图像分析中的标注数据不足问题。通过结合图像和放射学发现,增强了对比学习。实验结果表明,该模型在图像-文本检索、分类和图像分割等任务中表现优异,强调了文本相似性在医学图像基础模型构建中的重要性。

SeLIP: Similarity Enhanced Contrastive Language-Image Pretraining for Multi-modal Head MRI

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-25T00:00:00Z

本研究提出了TULIP模型,旨在改善现有图像-文本对比模型在视觉任务中的不足。通过数据增强和对比学习,TULIP能够更有效地学习细粒度视觉特征,并保持全局语义一致性。实验结果显示,TULIP在多个基准测试中超越了现有模型,尤其在零-shot任务和少量样本分类上表现显著提升。

Unified Language-Image Pretraining: TULIP

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究提出EgoDTM模型,解决自我中心视频语言预训练中缺乏三维理解的问题。该模型结合大规模3D视频预训练与视频-文本对比学习,通过轻量级三维解码器高效学习三维感知。实验结果表明,EgoDTM在多项任务中表现优异,展现出卓越的3D视觉理解能力。

EgoDTM: Towards 3D-Aware Egocentric Video-Language Pretraining

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究提出MASS框架,旨在解决大型语言模型预训练中的数据选择问题。该框架通过数学推理技能图有效捕捉数学技能及其关系,实验结果显示显著提升了模型的训练效率和效果。

A Mathematical Data Selection Framework Using Skill Graphs for Pretraining Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究提出了SkyLadder上下文窗口调度策略,旨在提高LLM预训练中长上下文窗口的效率。实验结果显示,SkyLadder在基准测试中提升了模型性能,并提高了22%的训练速度,显著优化了预训练效率。

SkyLadder: Achieving Faster and Better Pretraining via Context Window Scheduling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究提出了一种去噪分数蒸馏(DSD)方法,旨在提升扩散模型在低质量数据下的生成性能。通过在噪声样本上预训练并蒸馏为一步生成器,DSD显著改善了生成样本的质量。

Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究提出了一种通用的超参数缩放法则,解决了大型语言模型的超参数优化问题。研究发现,最佳学习率与模型参数和数据规模呈幂律关系,而批次大小主要与数据规模相关。这为模型性能优化提供了有效工具。

Predictable Scaling: Part One - Optimal Hyperparameter Scaling Laws in Pretraining Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

GLM是一种通用语言模型,通过自回归填空预训练,结合2D位置编码和混合任务训练,提升了自然语言理解与生成的性能。实验表明,GLM在多个任务上优于BERT和T5,展现了其灵活性和可推广性。

论文分享:GLM: General Language Model Pretraining

京东科技开发者
京东科技开发者 · 2025-03-05T03:04:55Z

本研究提出了一种新型教师-学生多任务框架,以提高脓毒症死亡率预测的准确性。通过自监督预训练,该框架有效应对血管活性药物评分的动态变化和数据缺失问题,AUROC达到0.82,强调临床和社会因素在重症监护中的重要性,助力早期识别高风险患者。

A Novel Multi-Task Teacher-Student Architecture with Self-Supervised Pretraining for 48-Hour Vasoactive Drug Trend Analysis in Sepsis Mortality Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z

本研究提出了一种新方法,通过引入归纳偏见来增强CLIP模型在复杂组合场景中的理解能力,提升多对象组合理解的性能。

Object-Centric Binding in Contrastive Language-Image Pretraining

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z

本研究探讨了通用深度神经网络模型在自然视频中预测遮挡区域的物理理解。模型通过联合学习抽象表示,有效理解物体的持久性和形状一致性,经过一周训练后表现超越偶然,挑战传统观念。

The Emergence of Intuitive Physics Understanding under Self-Supervised Pretraining

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究提出了一种新的实例级重加权算法,通过动态调整样本权重,聚焦于信息量大的样本,解决大型语言模型预训练中的样本重视不均问题。实验证明该方法能加速收敛并提升性能。

Dynamic Loss-Based Sample Reweighting to Improve Pretraining of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究提出了一种新颖的动作时间连贯性学习方法(AcTOL),旨在解决视觉-语言预训练中因过度关注未来帧导致的关联错误。该方法通过语义对比学习视频帧的自然顺序,显著提升了下游操作任务的性能,并增强了对不同语言风格指令的鲁棒性,推动了具身智能体的发展。

Provable Ordering and Continuity in Vision-Language Pretraining for Generalizable Embodied Agents

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本研究提出了一种基于视觉变换器的双流自监督预训练网络ViT-2SPN,旨在解决OCT诊断工具的数据集不足和隐私问题。通过OCTMNIST数据集进行自监督预训练,该方法在分类任务中实现了0.93的平均AUC和0.77的准确率,显著优于现有方法。

Vision Transformer-based Dual-Stream Self-Supervised Pretraining Network for Retinal OCT Classification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-28T00:00:00Z

本研究探讨在训练大型语言模型时如何平衡数据的质量、数量和来源多样性。提出了两种新方法:UtiliMax和模型估计数据效用(MEDU),显著提高了训练效率并降低了计算需求,为数据混合的自动化和高效计算提供了新框架。

Optimizing Pretraining Data Mixtures with LLM-Estimated Utility

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z

本研究探讨了机器学习模型在小数据集上进行不确定性校准的挑战。通过受神经科学启发的随机噪声预训练方法,研究表明该方法能有效提高神经网络的不确定性校准,使信心水平与实际准确性一致,并增强对未知数据的识别能力。

Pretraining with Random Noise for Uncertainty Calibration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码