小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Ries 黑五4折优惠:看中文也能轻松涨词汇,浏览器英语环境生成器重磅升级,发布 iOS 客户端

Ries是一款浏览器扩展和iOS应用,通过智能分析中文网页和视频字幕,逐步将中文替换为英文,帮助用户提升英语词汇量。它实时调整内容以适应用户的英语水平,提供沉浸式学习体验,促进日常英语接触。

Ries 黑五4折优惠:看中文也能轻松涨词汇,浏览器英语环境生成器重磅升级,发布 iOS 客户端

小众软件
小众软件 · 2025-11-30T10:08:54Z
使用AI学习任何语言

学习新语言可能会有压力,但借助AI工具如ChatGPT和DeepSeek,可以提高流利度和词汇量。新课程由经验丰富的教师Borys授课,适合各级学习者,提供基本提示、学习计划和雅思备考策略,帮助更有效地提升语言能力。

使用AI学习任何语言

freeCodeCamp.org
freeCodeCamp.org · 2025-03-20T19:46:11Z
智能AI训练方法在保持性能的同时将语言模型训练时间缩短25%

本文介绍了一种新颖的课程学习方法,通过逐步增加词汇量来训练大型语言模型,降低计算成本,同时保持模型质量。训练时间缩短25%,性能相似,适用于小型和大型语言模型。

智能AI训练方法在保持性能的同时将语言模型训练时间缩短25%

DEV Community
DEV Community · 2025-02-28T09:59:11Z
在大词汇量语言模型中减少损失

随着语言模型词汇量的增加,交叉熵的内存占用显著上升。我们提出了Cut Cross-Entropy(CCE)方法,仅计算正确标记的logit,从而显著降低内存消耗。以Gemma 2模型为例,CCE将损失计算的内存从24GB降至1MB,训练时间内存从28GB降至1GB,且不影响训练速度和收敛性。

在大词汇量语言模型中减少损失

Apple Machine Learning Research
Apple Machine Learning Research · 2025-02-07T00:00:00Z
研究表明,扩大词汇量使人工智能语言模型更智能、更快速

研究表明,扩大词汇量能提升语言模型性能。采用“过度分词”策略优于传统方法,且随着模型规模增大,词汇扩展的好处也随之增加。该方法提高了20%的训练速度,且质量保持不变,适用于多种语言和任务。

研究表明,扩大词汇量使人工智能语言模型更智能、更快速

DEV Community
DEV Community · 2025-02-03T09:03:33Z

本研究探讨了语言模型中标记粒度对惊讶度预测的影响,提出了一种新方法。结果表明,标记粒度显著影响预测能力,尤其是8,000词汇量的标记最具预测性,对认知建模应用具有重要意义。

The Impact of Token Granularity on Surprise Prediction Ability in Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

本研究解决了大型语言模型在训练过程中,因交叉熵计算导致的内存消耗过高的问题。提出了一种新的方法——Cut Cross-Entropy (CCE),该方法不需要在全局内存中生成所有的logits,而是仅计算正确token的logit,并动态评估log-sum-exp。实验结果表明,CCE显著减少了内存占用,同时不影响训练速度和收敛性。

降低大词汇量语言模型的损失

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z

本研究提出了一种高性价比的方法,解决双语大型语言模型在英语与其他语言间支持不足的问题。通过扩大词汇量和新嵌入初始化,显著提升了生成文本质量,促进了对低代表性语言的公平支持。

从以英语为中心到有效的双语:支持低代表性语言的自定义分词器的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本研究考察了不同的分词策略和词汇量对阿拉伯语言模型在自然语言处理任务中的影响。结果显示,Farasa的字节对编码在多个任务中表现优于其他策略,而词汇量对模型性能的影响有限。建议改进分词策略以解决方言挑战,并扩大数据集以涵盖丰富的基于方言的阿拉伯语言。

数据混合推断:BPE 分词器对其训练数据的揭示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

本文介绍了使用字符级循环神经网络的联邦学习方法,扩展智能手机虚拟键盘的词汇量,学习未知单词而不泄露敏感文本。研究表明该方法可行,模型对常用未知单词有良好识别和较低交叉熵损失。

通过低成本数据策略提升印度 TTS 系统在实际应用中的词汇外表现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

研究发现,子词词汇大小与大型语言模型(LLM)性能呈正相关。使用更大的词汇大小可以提高LLM性能,并且使用新的词汇代替预定义的词汇也能提高模型性能。

大词汇量提升大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z
如何高效地学习英语

学习英语的关键在于扩大词汇量和提高表达能力。有效的方法包括反复听、看影视剧和阅读书籍,以增强对词汇的理解和使用。此外,参与记笔记和复习等有针对性的词汇学习活动,以及进行写作和讨论等输出练习,能够帮助在实际交流中灵活运用所学词汇。

如何高效地学习英语

Limboy
Limboy · 2024-06-04T00:00:00Z
混阅 – 中英混合阅读:就不能好好阅读吗:利用 LLM 将中文内容转换为中英混合,扩展词汇量

混阅是一个将中文内容转换为中英混合形式的阅读工具,利用LLM将部分词语替换为英文单词,促进语言学习。通过混阅,可以将中文文章转换为中英混合形式,使用中文context实现英语词汇增长。混阅使用code-mixing策略,将中文与英文进行比较和联系,自然吸收新词汇,促进语言习得。

混阅 – 中英混合阅读:就不能好好阅读吗:利用 LLM 将中文内容转换为中英混合,扩展词汇量

小众软件
小众软件 · 2024-05-18T02:31:00Z

本研究探究了分词策略和词汇量对阿拉伯语言模型在自然语言处理任务中的影响。结果显示Farasa的字节对编码在多个任务中表现优秀,但在情感分析中存在方言特定的问题。词汇量对模型性能的影响有限,挑战了既有信念。建议改进分词策略以解决方言挑战,并扩大数据集以涵盖丰富的基于方言的阿拉伯语言。这项研究为阿拉伯语言模型的发展奠定了基础。

构建 BPE 分词 DFA

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

本文介绍了一种新的预训练语言模型AlephBERTGimmel,适用于现代希伯来语,使用128K词汇表。与其他希伯来语模型进行对比分析,实验证明更大的词汇量可以提高模型性能,并在希伯来基准测试中取得了新的最佳结果。

mALBERT:一个紧凑的多语言 BERT 模型是否值得?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-27T00:00:00Z

我们提出了OpenOcc,一种将3D场景重建和开放词汇理解与神经辐射场结合的新型框架。通过占位表示法对场景的几何结构进行建模,并通过体素渲染将预训练的开放词汇模型蒸馏为3D语言场,以实现零-shot推理。实验证明,我们的方法在3D场景理解任务中取得了有竞争力的性能。

OpenOcc:基于占据表示的开放词汇量三维场景重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-18T00:00:00Z

作者分享了自己在四级考试前几天刷完了100天的多邻国学习计划,认为碎片化时间的利用是值得的,可以提高句子组织能力和词汇量。他称赞了多邻国的教学方式和提醒功能,祝自己在英语四级考试中能一次通过。

百词斩四级辞书刷完/365天纪念/多邻国百天核电

晓空blog
晓空blog · 2023-12-14T15:34:24Z

DeepMind的新论文表明,大型预训练语言模型在多模式数据集上具有出色的压缩率。算术编码器能够实现出色的压缩效果,同时研究结果与缩放规律相吻合。增加词汇量可以提高较小模型的压缩率,但对于较大的模型来说情况恰恰相反。

DeepMind《语言建模就是压缩》论文分析

极道
极道 · 2023-09-29T07:07:00Z

该文提出了一种使用基于文本转图像的扩散模型进行文本到3D合成的方法,绕过了需要大规模标记的3D数据集和能够去噪的3D数据的限制。该方法使用梯度下降优化3D模型,并使用概率密度蒸馏引入的损失函数将2D扩散模型与3D模型相结合。该方法不需要3D训练数据,也不需要修改图像扩散模型,证明了使用预训练的图像扩散模型作为先验的有效性。

大词汇量三维扩散模型与变压器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-14T00:00:00Z

该论文提出了一种基于神经网络模型的分步神经机器翻译(FNMT)方法,解决了机器翻译中目标语言词汇量和未知词汇数的问题。在 IWSLT'15 英法任务中,该方法表现优异,与基于单词和基于 BPE 的神经机器翻译系统相当。

在分解神经传输器中融入基于类别的语言模型的命名实体识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码