小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
为BERT训练准备数据

本文介绍了为BERT模型准备训练数据的过程,包括创建掩码语言模型(MLM)和下一个句子预测(NSP)数据。首先处理文档生成句子对,然后对句子进行掩码处理,最后将数据保存为parquet格式以便重用。这些步骤有效地为BERT模型提供训练数据。

为BERT训练准备数据

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-24T05:22:00Z

本研究提出了一种新颖的任务指导反课程学习方案,解决了掩码语言模型训练中掩码选择的随机性和固定比例问题,显著提升了情感分析、主题分类和作者归属等任务的性能。

任务指导反课程的掩码技术改善文本下游性能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

大模型(如chatGPT)的训练是通过自监督学习进行的,自监督学习是一种无监督学习方式,通过伪标签进行训练。常见的自监督学习任务有掩码语言模型和因果语言模型。因果语言模型通过预测下一个词来学习文本的顺序结构和语言生成过程。通过自监督学习,模型可以学习到自然语言的结构和句式。

3分钟搞懂大模型的训练过程

六虎
六虎 · 2024-04-11T03:52:43Z

Lil-Bevo是BabyLM Challenge的参赛作品,使用三种方法对掩码语言模型进行预训练。基准模型表现超过随机猜测,但低于较大规模语言模型。训练较短的序列效果更好,预训练音乐对性能影响较小。掩码语言建模在一般情况下未提高模型性能,但在特定BLiMP任务上有帮助。在少量数据上训练性能良好的语言模型是困难但有潜力的任务。需要进一步研究以探索更显著的性能提升。

[征稿] 第二届 BabyLM 挑战赛:基于合理发展语料的高效预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-09T00:00:00Z

本文介绍了一种修改的transformer编码器--NarrowBERT,通过在预训练期间仅在屏蔽令牌上操作,增加了掩码语言模型预训练的吞吐量。NarrowBERT在推理时间的吞吐量提高了3.5倍,性能降低最小,并且在多个任务上与标准BERT相当。

DrBERT: BERT 预训练中揭示掩码语言模型解码器的潜力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-29T00:00:00Z

GEST是一个新的数据集,用于评估掩码语言模型和机器翻译系统中的性别刻板推理。该数据集包含16个关于男性和女性的性别刻板印象的样本,适用于9种斯拉夫语言和英语。通过使用GEST评估了11个掩码语言模型和4个机器翻译系统,发现几乎所有评估模型和语言中都存在显著和一致数量的刻板推理。

女性美丽,男性领导:机器翻译和语言建模中的性别刻板印象

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-30T00:00:00Z

该研究提出了Lil-Bevo作为BabyLM Challenge的参赛作品,使用三种方法对掩码语言模型进行预训练,包括使用音乐数据进行初始预训练、逐步增加序列长度以及对特定令牌进行屏蔽。研究发现,训练较短的序列比训练较长的序列效果更好,预训练音乐可能提高性能但影响很小。针对性的掩码语言建模在一些特定的BLiMP任务上有帮助。

迷你心智:探索 Bebeshka 和 Zlata 婴儿模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-06T00:00:00Z

该研究提出了Lil-Bevo作为BabyLM Challenge的参赛作品,使用三种方法对掩码语言模型进行预训练,包括使用音乐数据进行初始预训练、逐步增加序列长度以及对特定令牌进行屏蔽。研究发现,训练较短的序列比训练较长的序列效果更好,预训练音乐对性能提升影响较小。针对性的掩码语言建模在一些特定的BLiMP任务上有帮助。

信息过载:为 BabyLMs 保持简单的训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-03T00:00:00Z

通过收集离散声学代码并微调,AudioFormer提出了一种学习音频特征表示的方法。使用神经音频编解码模型生成离散声学代码,并利用它们训练掩码语言模型,获取音频特征表示。实验结果表明,AudioFormer在多个数据集上取得显著提升,甚至超越音频-视觉多模分类模型的性能。

AudioFormer: 从离散声学编码中学习音频特征表示的音频 Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-14T00:00:00Z
使用TensorFlow和TPU训练🤗 Transformers语言模型

本文介绍了使用TensorFlow和TPU训练掩码语言模型的方法,包括数据集的处理、模型的训练和优势的强调。

使用TensorFlow和TPU训练🤗 Transformers语言模型

Hugging Face - Blog
Hugging Face - Blog · 2023-04-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码