小红花·文摘

微调BERT模型

MachineLearningMastery.com ·

This article is divided into three parts; they are: • Creating a BERT Model the Easy Way • Creating a BERT Model from Scratch with PyTorch • Pre-training the BERT Model If your goal is to create a...

Pretrain a BERT Model from Scratch

MachineLearningMastery.com ·

This article is divided into four parts; they are: • Preparing Documents • Creating Sentence Pairs from Document • Masking Tokens • Saving the Training Data for Reuse Unlike decoder-only models,...

Preparing Data for BERT Training

MachineLearningMastery.com ·

通用的dLLM开发框架，让BERT掌握扩散式对话

机器之心 ·

This article is divided into two parts; they are: • Architecture and Training of BERT • Variations of BERT BERT is an encoder-only model.

BERT Models and Its Variants

MachineLearningMastery.com ·

This article is divided into two parts; they are: • Picking a Dataset • Training a Tokenizer To keep things simple, we'll use English text only.

Training a Tokenizer for BERT Models

MachineLearningMastery.com ·

KDD 2025 Best Paper Runner-Up | EI-BERT：超紧凑语言模型压缩框架

机器之心 ·

趋势科技发现新型勒索软件BERT在全球范围内攻击医疗、科技和会展行业。该软件通过PowerShell在Windows系统中实施攻击，并在Linux上表现出更强的攻击性，采用模块化设计和即时加密。BERT与REvil勒索软件相似，可能是基于历史框架开发的。

新型BERT勒索软件肆虐：多线程攻击同时针对Windows、Linux及ESXi系统

FreeBuf网络安全行业门户 ·

如何修复使用BERT与TensorFlow时常见的错误

DEV Community ·

本研究提出IM-BERT，旨在解决大规模参数模型在有限数据集上的对抗攻击和过拟合问题。通过将BERT层视为动态系统，显著提升了模型在低资源场景下的鲁棒性，实验结果显示准确率提高约5.9个百分点。

IM-BERT：通过隐式欧拉方法提高BERT的鲁棒性

BriefGPT - AI 论文速递 ·

本研究解决了医学成像中标签获取困难的问题，通过引入nn-MobileNet框架，采用BERT式自监督学习方法，利用大量未标记的视网膜图像进行预训练，以提高下游应用的性能。研究结果表明，此方法在阿尔茨海默病、帕金森病及多种视网膜疾病的识别中显著提升了表现，展示了在标签稀缺情况下，CNN的潜力。

一种基于BERT风格的自监督学习CNN用于视网膜图像疾病鉴定

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，利用情感分析和BERTopic模型预测大型开源软件库中的缺陷解决时间、修复时间及最终状态。研究结果表明，情感分析在判断缺陷是否会被修复方面具有重要价值。

Predicting Bug Outcomes in Large Open Source Software Repositories: Leveraging Sentiment Analysis and BERT Topic Modeling

BriefGPT - AI 论文速递 ·

本研究提出了一种名为llm-jp-modernbert的现代BERT模型，旨在解决大规模语料库和长上下文的预训练问题。该模型在8192个标记的上下文长度上进行训练，尽管在下游任务中未超越现有基线，但在填充掩码评估中表现良好。

微调BERT模型

Pretrain a BERT Model from Scratch

Preparing Data for BERT Training

通用的dLLM开发框架，让BERT掌握扩散式对话

BERT Models and Its Variants

Training a Tokenizer for BERT Models

KDD 2025 Best Paper Runner-Up | EI-BERT：超紧凑语言模型压缩框架

新型BERT勒索软件肆虐：多线程攻击同时针对Windows、Linux及ESXi系统

如何修复使用BERT与TensorFlow时常见的错误

IM-BERT：通过隐式欧拉方法提高BERT的鲁棒性

一种基于BERT风格的自监督学习CNN用于视网膜图像疾病鉴定

Predicting Bug Outcomes in Large Open Source Software Repositories: Leveraging Sentiment Analysis and BERT Topic Modeling

llm-jp-modernbert: A Modern BERT Model Trained on a Large-Scale Japanese Corpus with Support for Long Context Lengths

在使用大型语言模型注释进行BERT分类器训练时的风险

临床现代BERT：更快、更小的人工智能阅读16页医疗文档

利用BERT推进漏洞分类：多目标学习模型

Using BERT for Construction Recognition and Disambiguation: A Case Study on NPN

现代BERT在胸部CT发现分类中比传统BERT更高效

使用双向LSTM微调BERT以进行细粒度电影评论情感分析

通过ICU-BERT改善复杂重症监护数据的表示学习