小红花·文摘

最近，一个名为“gpt2-chatbot”的神秘AI模型在大模型竞技场上引起了广泛关注。它展现出了惊人的能力，可能超越了备受瞩目的GPT-4模型。有人认为它可能是OpenAI的GPT-2模型的版本，也有人认为它可能是GPT系列的下一个版本。无论如何，它的出现预示着AI技术的飞跃。

【AI新突破】GPT2模型现身，实力或超越GPT4，奥特曼确认，引发热议！

dotNET跨平台 ·

通过计算 GPT2 模型中神经元激活的成对相关性，研究了不同随机种子下神经元的普遍性，并发现 1-5% 的神经元是普遍的。对这些普遍神经元进行了详细研究，发现它们通常具有清晰的解释，并将其归类到几个神经元家族中。通过研究神经元权重的模式，确定了神经元在简单电路中的几个普遍功能角色。

GPT2 语言模型中的通用神经元

BriefGPT - AI 论文速递 ·

MindSpore是一个全场景深度学习框架，支持第三方前端，提供ModelZoo、Extend、Science、Expression、Data、Compiler、Runtime、Insight、Armour等功能，期待更多开发者参与。网络迁移指的是把参考源码中所使用的框架API替换为MindSpore中的API，可以参考MindNLP中的Bert模型迁移代码，但需要注意hugging face自封装的类别和函数以及API参数的差异。

基于Mindspore2.0的GPT2预训练模型迁移教程

华为云官方博客 ·

上一篇文章中，分析了bert的tokenizer的细节，本篇继续分析gpt2的tokenizer的细节。 bpe的基本原理可以参考这篇文章：https://huggingface.co/course/chapter6/5?fw=pt 该tokenizer整体调用入口是encode方法。 """Byte pair encoding utilities""" import...

gpt2 tokenizer源码解析

李文举 ·

使用gpt2进行文本生成时，有几个参数可调，本文简要总结了一下这些个参数的作用。默认的解码方式greedy search。后续的参数调整都是围绕着这种解码的缺点进行的。 1、 num_beams和early_stopping greedy...

gpt2解码参数解析

李文举 ·

From GPT2 to Stable Diffusion: Hugging Face arrives to the Elixir community

Hugging Face - Blog ·

周末，继续文本生成的话题。前几天我们基于 Hugging Face 的中文歌词GPT-2预训练模型（Chine […]

现代文自动生成器：来试试用GPT2自动写中文

我爱自然语言处理 ·