小红花·文摘

本研究提出了一种名为BM-MAE的遮挡图像建模预训练策略，旨在解决多模态医学影像中的缺失模态问题。该方法提高了医疗成像的资源利用效率，并在多项任务中优于传统的单模态预训练方法，展示了其实际应用价值。

Multimodal Masked Autoencoder Pre-training for 3D MRI-Based Brain Tumor Analysis

BriefGPT - AI 论文速递 ·

本研究探讨了视觉语言模型在尤文肉瘤（ES）诊断中的应用，分析了不同预训练策略在数字化组织微阵列中区分ES与其他肿瘤的能力。结果显示，视觉语言监督（VLS）显著提高了诊断准确性，具有重要的临床应用潜力。

Exploring Visual Language Models as a Powerful Tool for the Diagnosis of Ewing Sarcoma

BriefGPT - AI 论文速递 ·

本研究提出了一种新型无编码器多模态大语言模型SynerGen-VL，采用令牌折叠机制和视觉专家的预训练策略，简化了模型架构和训练流程，支持高分辨率图像理解。经过训练，SynerGen-VL的性能与现有模型相当或更佳，展现了统一多模态模型的潜力。

SynerGen-VL: Towards Synergistic Image Understanding and Generation with Vision Experts and Token Folding

BriefGPT - AI 论文速递 ·

本文提出了一种双层联合无监督与监督训练（BL-JUST）框架，旨在改进传统的预训练与微调策略。该方法通过同时最小化无监督与监督的损失函数，提升声学模型的通用性和任务特定性。研究表明，BL-JUST在多个数据集和架构下表现优于传统策略和半监督技术。

Bilevel Joint Unsupervised and Supervised Training Framework for Automatic Speech Recognition

BriefGPT - AI 论文速递 ·

本研究提出了一种新的预训练策略GRAIN，旨在提升视觉语言模型在细粒度实体识别和未见概念的零-shot性能。通过对齐文本描述和图像表示，模型在识别新概念和其他任务中的检索性能显著提高。

Combining Descriptions with Images to Enhance Zero-Shot Visual Recognition

BriefGPT - AI 论文速递 ·

本研究提出了一种新型预训练策略，强调氨基酸残基间的相互作用，提升了从序列数据中提取共演化特征的能力。实验结果表明，该模型在多个基准任务中表现优异，标志着蛋白质序列建模的重大进展。

SFM-Protein with Integrated Co-evolution Pre-training: Advanced Protein Sequence Representation

BriefGPT - AI 论文速递 ·

本研究提出了一种主动遗忘的预训练策略，以提升解码器语言模型在非英语语言上的表现。实验结果表明，该方法有效增强了模型的跨语言迁移能力，改善了多语言表示，从而在多个任务中取得了更好的性能。

Exploring Pretraining via Active Forgetting to Improve Cross-Lingual Transfer of Decoder Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新的预训练策略HELM，解决了现有mRNA语言模型未能考虑密码子结构层次特性的问题。HELM在多个任务中性能提升约8%，并能生成多样化的mRNA序列，显示出其在生物信息学中的重要价值。

HELM: Hierarchical Encoding for mRNA Language Modeling

BriefGPT - AI 论文速递 ·

本文探讨了多语句子编码器在不同预训练策略下对语言特性的表征，特别是语法一致性和形态句法特征的影响。研究发现，掩码语言模型和自回归模型在主谓一致性处理上存在差异，多语言模型在不同语言的编码表现出显著差异。这些发现为未来语言模型的训练和优化提供了重要参考。

通过多语言主谓一致探讨句子嵌入中的句法信息

BriefGPT - AI 论文速递 ·

本文提出了一种针对图数据集的预训练策略和自监督方法，以提高图神经网络（GNN）在分子性质预测和蛋白质功能预测中的表现。研究表明，这些方法在多个蛋白质相关任务中取得了最先进的性能，显著提升了泛化能力和鲁棒性。

利用图神经网络的蛋白质柔性预测的先进原子级表示

BriefGPT - AI 论文速递 ·

本文提出了一种针对医学图像的视觉问答模型LaPA，结合多模态提示生成和领域特定预训练策略，显著提高了在多个医学视觉问答数据集上的准确率，解决了数据集规模小和诊断性能不足的问题。实验结果表明，该模型在VQA-RAD、SLAKE和VQA-2019上超越了现有最先进模型。

医学视觉问答的定向视觉提示

BriefGPT - AI 论文速递 ·

数据压缩语言模型（DataComp-LM）：寻找下一代语言模型训练集

Apple Machine Learning Research ·

本文提出了一种基于Transformer的框架（FaultFormer），用于分析振动信号以预测轴承故障。通过数据增强和傅里叶模态提取，训练了Transformer编码器，提升了预测准确度。此外，研究还提出了预训练策略，以适应新数据和设备。

基于 Transformer 和统计特征嵌入的制造传感器数据预测模型

BriefGPT - AI 论文速递 ·

本文探讨了多语言模型中的词汇容量和预训练策略，提出通过扩展词汇表、使用双语数据和构建高质量指令数据集来提升低资源语言的表现。研究表明，简单的词向量初始化方法在资源有限的环境中更有效，且句子级词汇表方法在英法翻译中优于传统大词汇表系统。

大词汇量提升大型语言模型

BriefGPT - AI 论文速递 ·

本文研究了零样本多标签文档分类在HR领域的应用，实验结果显示其平均精度比传统分类器高12%。提出的两阶段框架结合数据和特征扩充，利用语义知识结构，显著提高了分类准确率。同时，研究探讨了预训练策略和加权最大间隔框架在零样本学习中的应用，取得了良好效果。

常见采购词汇分类的零样本层次分类

BriefGPT - AI 论文速递 ·

该论文提出了一种图形遮盖的预训练策略，显著提升了图到文本生成任务中的模型效果，尤其在零样本学习场景中表现优越。

GraSAME：通过图导引的自注意机制向预训练语言模型注入标记级结构信息

BriefGPT - AI 论文速递 ·

本文探讨了一种新的预训练策略，通过继续训练 BART 模型生成简单文本，以提高简化任务的表现。研究表明，大型语言模型（LLMs）在句子简化方面优于传统方法，并提出了一种结合词汇和深度学习技术的透明文本简化流水线。实验结果显示，LLMs 在儿童教育材料生成和文本分类任务中表现出色，尤其在低资源场景下，新型词汇简化方法有效提升了性能。

简单变得更难：LLMs 在简化语料库上表现出一致的行为吗？

BriefGPT - AI 论文速递 ·

本文介绍了一种基于Transformer的框架（FaultFormer），用于预测轴承故障。通过数据增强和傅里叶模态提取方法，训练了一个高准确度的Transformer编码器。同时，提出了两种预训练策略，为大型可推广Transformer的开发铺平了道路。

用于诊断轴承故障的振动信号二次时频分析

BriefGPT - AI 论文速递 ·

旋转机械可靠故障检测中声音与振动的探索

BriefGPT - AI 论文速递 ·

本文提出了一种新的叙述引导的预训练策略，利用电影字幕和简介构建对话-叙述并行语料库，并用BART模型进行预训练。实验结果表明，该方法在零-shot性能和对话理解能力方面表现出优越性。

代码模型是零 - shot 预处理推理器

BriefGPT - AI 论文速递 ·