小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
开发者的25+个AI技术资源 - 2025年1月27日

文章介绍了多种AI工具和项目,包括在GPT2中应用的量化技术、个性化认证考试助手CertAI_Buddy以及YouTube赞助识别工具SponsoShield。这些创新旨在提高内容创作效率和用户体验。

开发者的25+个AI技术资源 - 2025年1月27日

DEV Community
DEV Community · 2025-01-26T19:11:42Z

神经网络模型性能高但难以解释。文章提出电路探测技术,通过分析中间变量的低层电路,实现参数切割和因果分析。在简单算术任务中,该方法有效解密模型算法,揭示内部结构,追踪电路发展。应用于GPT2模型,发现负责主谓一致和反身指代的电路。

大语言模型中的电路假设检验

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

神经网络模型性能高但难以解释。本文提出电路探测技术,通过发现中间变量的低层电路,实现参数切割和因果分析。在简单算术任务中,该方法有效解密模型算法,揭示内部结构,追踪训练过程。应用于GPT2模型,发现负责主谓一致和反身指代的电路。

电路组合:探索基于变压器的语言模型中的模块化结构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

最近,一个名为“gpt2-chatbot”的神秘AI模型在大模型竞技场上引起了广泛关注。它展现出了惊人的能力,可能超越了备受瞩目的GPT-4模型。有人认为它可能是OpenAI的GPT-2模型的版本,也有人认为它可能是GPT系列的下一个版本。无论如何,它的出现预示着AI技术的飞跃。

【AI新突破】GPT2模型现身,实力或超越GPT4,奥特曼确认,引发热议!

dotNET跨平台
dotNET跨平台 · 2024-05-01T23:55:21Z

该研究比较了三种方法,发现自回归的单向语言模型(如GPT2)在生成流畅度方面表现更好,但难以遵循所请求的事实。研究提出了基于计划和填空模型的解决方案,该解决方案在生成流畅度和内容准确性方面都有竞争力。

断时而止:文本生成中的语义漂移研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-08T00:00:00Z

通过计算 GPT2 模型中神经元激活的成对相关性,研究了不同随机种子下神经元的普遍性,并发现 1-5% 的神经元是普遍的。对这些普遍神经元进行了详细研究,发现它们通常具有清晰的解释,并将其归类到几个神经元家族中。通过研究神经元权重的模式,确定了神经元在简单电路中的几个普遍功能角色。

GPT2 语言模型中的通用神经元

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-22T00:00:00Z

本文介绍了在SQL中实现大型语言模型的方法,包括生成式大型语言模型的技术原理和GPT2的实现过程。作者详细讲解了分词器和字典的构建,以及使用递归CTE将文本分割为标记并生成编码后的表示的方法。同时介绍了GPT2中的生成文本过程和生成算法。

狠人用500行SQL实现GPT大模型

极道
极道 · 2024-01-07T01:28:00Z

该文介绍了一种基于Transformer的文本到视频模型,使用U-Net从噪音版本重构图像,并使用GPT2在UCF101数据集上进行测试,展示其能够生成有希望的视频。

通过 Transformer 实现的简单文本到视频模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-26T00:00:00Z

该研究评估了三种基于自然语言的控制生成任务方法,发现自回归的单向语言模型如GPT2生成流畅度更好,但难以遵循所请求的事实。研究提出了基于计划和填空模型的解决方案,使用精细调整的XLNet生成流畅度有竞争力,同时遵循所请求的内容。

通过动态知识选择优化文本生成的事实准确性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-30T00:00:00Z

该研究评估了三种基于自然语言的控制生成任务方法,发现自回归的单向语言模型如GPT2生成流畅度更好,但难以遵循所请求的事实。研究提出了基于计划和填空模型的解决方案,使用精细调整的XLNet生成流畅度有竞争力,同时遵循所请求的内容。

基于提示的长度控制生成与强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-23T00:00:00Z

MindSpore是一个全场景深度学习框架,支持第三方前端,提供ModelZoo、Extend、Science、Expression、Data、Compiler、Runtime、Insight、Armour等功能,期待更多开发者参与。网络迁移指的是把参考源码中所使用的框架API替换为MindSpore中的API,可以参考MindNLP中的Bert模型迁移代码,但需要注意hugging face自封装的类别和函数以及API参数的差异。

基于Mindspore2.0的GPT2预训练模型迁移教程

华为云官方博客
华为云官方博客 · 2023-03-10T07:59:49Z

该文章介绍了字节对编码(BPE)工具,主要功能包括将UTF-8字节映射到Unicode字符、提取单词中的符号对,以及文本的编码和解码。通过合并频率最高的字节对,BPE能够有效处理大规模数据集,减少未知字符的出现。

gpt2 tokenizer源码解析

李文举
李文举 · 2023-01-10T01:20:08Z

本文总结了GPT-2文本生成中的解码参数,包括num_beams、no_repeat_ngram_size、num_return_sequences、do_sample、temperature、top_k和top_p,解析了各参数的作用及注意事项。

gpt2解码参数解析

李文举
李文举 · 2022-12-28T01:20:08Z

From GPT2 to Stable Diffusion: Hugging Face arrives to the Elixir community

Hugging Face - Blog
Hugging Face - Blog · 2022-12-09T00:00:00Z

周末,继续文本生成的话题。前几天我们基于 Hugging Face 的中文歌词GPT-2预训练模型(Chine […]

现代文自动生成器:来试试用GPT2自动写中文

我爱自然语言处理
我爱自然语言处理 · 2021-08-07T04:34:54Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码