小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
《GPT 图解》笔记:N-Gram、NPLM、LSTM

本文介绍了语言模型的发展历程,包括N-Gram、NPLM、RNN和LSTM等。N-Gram通过统计前n-1个词的概率进行预测,但缺乏泛化能力;NPLM引入词向量,具备一定的泛化能力;RNN和LSTM通过递归状态支持变长序列,解决了长期依赖问题。总结了N-Gram和Bag-of-Words的基本原理及应用。

《GPT 图解》笔记:N-Gram、NPLM、LSTM

Ying’s Blog
Ying’s Blog · 2026-05-10T08:00:35Z

本研究提出了一种新基准,通过n-gram统计和规则评估大型语言模型(LLMs)的开放式文本生成,避免了人工判断的依赖。该基准与GPT-4o评估高度相关,显著降低了计算资源消耗,展示了其有效性。

A Non-Judgmental Benchmark for Open-Ended Generation of Large Language Models Based on Distributional Assumptions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本研究提出了De-mark框架,通过随机查询策略有效去除语言模型中的n-gram水印,并评估其强度。实验表明,De-mark在流行语言模型上表现出色,对未来内容生成有重要影响。

Watermark Removal: Eliminating Watermarks in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z
如何使用 MySQL 全文检索

本文介绍了MySQL的全文检索功能,包括创建全文索引、插入数据和执行查询。全文检索提高了查询效率,支持复杂搜索。MySQL 5.6及以上版本支持Ngram解析器,适用于中文等语言,并提供了性能优化建议和适用场景。

如何使用 MySQL 全文检索

人言兑
人言兑 · 2024-07-17T11:45:04Z

本研究提出了一种改进的 Transformer 模型,结合 n-gram 语言模型与神经网络,以提升自然语言处理任务的性能。实验证明该方法优于传统模型,并强调了 n-gram 在文本分析中的重要性。此外,研究探讨了 Transformer 在抽象符号推理任务中的能力及其在不同行业的应用潜力。

Transformer 可以表示 $n$-gram 语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-23T00:00:00Z
谷歌图书 reportedly 正在索引低质量的AI生成作品

谷歌图书开始索引低质量书籍,这可能影响其语言跟踪工具Ngram的结果。许多书籍似乎由AI生成,包含常见的聊天机器人用语,且信息可能过时,影响学术研究的准确性。谷歌表示,近期作品尚未出现在Ngram结果中,但未来可能会更新数据。

谷歌图书 reportedly 正在索引低质量的AI生成作品

The Verge
The Verge · 2024-04-05T16:23:22Z

本文探讨了在无参考文本情况下的文本简化质量估计方法,比较了多种评估指标,发现基于 n-gram 的度量最能反映语法正确性和意义保留。研究提出了新的文档级简化任务和自动评估指标 D-SARI,分析了基准模型的缺点,并引入 SAMSA 方法评估结构简化质量,显示其与人类判断的相关性显著。

评估文档简化:关于分开评估简易性和意义保留的重要性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-04T00:00:00Z

本研究使用多语言BERT作为编码器,将n-gram信息融入词表示学习中,提出了一种中文文本到可视化的数据集。实验结果表明该数据集具有挑战性,值得进一步研究。

利用 nvBench 数据集的数据可视化自然语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-02T00:00:00Z

BLEU是评估机器翻译质量的指标,通过比较机器翻译与人工翻译的n-gram重合度、加权和长度惩罚来计算翻译的准确性。

BLEU的计算

李文举
李文举 · 2022-06-06T01:20:08Z

转载自简书本文链接地址: Elasticsearch通过ngram分词机制实现搜索推荐

elasticsearch通过ngram分词机制实现搜索推荐

祈雨的博客
祈雨的博客 · 2018-10-30T16:00:00Z
Python Load 169

GoCD与Kubernetes原生集成,提供一流的持续交付工具。Python使用ngram分析14亿行代码。Google Ngram查看器使用谷歌扫描的书籍数据绘制单词使用情况。Pandas库适用于各种数据形式。主题建模是从文本中提取隐藏主题的技术,使用Gensim包中的LDA算法。Python异常的权威指南。Predigame是一个教学平台,通过创建街机游戏教授编码基础知识。

Python Load 169

蠎周刊
蠎周刊 · 2018-04-02T03:42:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码