小红花·文摘 - 小红花技术领袖俱乐部

本文探讨了词嵌入的发展及其在自然语言处理中的重要性。词嵌入将离散词转换为连续向量，解决了传统one-hot编码的维度灾难和稀疏性问题。通过分析Firth的分布假设、word2vec和GloVe等方法，强调了词嵌入在捕捉语义相似性和类比关系中的作用。现代NLP模型如BERT和ELMo推动了上下文化词嵌入的发展，使同一词在不同上下文中具有不同表示。

【Transformer 与注意力机制】08 嵌入：从 one-hot 到分布式表示

土法炼钢兴趣小组的博客 ·

针对非结构化文本数据的三种特征工程技术

针对非结构化文本数据的三种特征工程技术

MachineLearningMastery.com ·

文本数据的七种特征工程技巧

文本数据的七种特征工程技巧

MachineLearningMastery.com ·

如何窥探本地大型语言模型的内部运作

如何窥探本地大型语言模型的内部运作

freeCodeCamp.org ·

为什么以及何时使用句子嵌入而非词嵌入

为什么以及何时使用句子嵌入而非词嵌入

MachineLearningMastery.com ·

词袋模型的工作原理 – 语言模型的基础

词袋模型的工作原理 – 语言模型的基础

freeCodeCamp.org ·

表格数据特征工程中的词嵌入

表格数据特征工程中的词嵌入

MachineLearningMastery.com ·

语言模型中的词嵌入

语言模型中的词嵌入

MachineLearningMastery.com ·

词嵌入与文本向量化的温和介绍

词嵌入与文本向量化的温和介绍

MachineLearningMastery.com ·

本研究提出了一种快速方法，通过结合相邻标记嵌入来优化预训练的静态词嵌入，有效解决词汇缺失问题，增强特定领域应用的多样性，并改善风暴相关术语的表示效果。

Self-Improving Token Embeddings

BriefGPT - AI 论文速递 ·

本文提出了一种基于双向LSTM/CRF的模型，解决了不同语言命名实体识别中的模型依赖性问题。该模型通过正交线性变换将目标语言的词嵌入转化为源语言的词嵌入，有效识别阿拉伯语命名实体。

Language-Independent Named Entity Recognition through Orthogonal Transformation of Word Vectors

BriefGPT - AI 论文速递 ·

从词语到向量：词嵌入的温和入门

从词语到向量：词嵌入的温和入门

DEV Community ·

本文介绍了Embedding技术在自然语言处理中的应用与发展。Embedding通过向量表示对象，已从Word Embedding扩展到多种形式，如Item和Graph，提升了机器学习和深度学习的效率。动态词嵌入模型如BERT和GPT解决了一词多义问题，推动了NLP性能的提升。

大模型背后的向量魔法：Embedding技术初探 - 程序设计实验室

程序设计实验室 ·

本研究分析多语言模型在低资源语言中的知识转移表现，探讨多语言词嵌入的一致性及模型结构，揭示其优势与局限，以促进自然语言处理技术的包容性发展。

多语言语言模型如何处理多种语言？

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法Comply，解决了生物启发神经网络在词嵌入学习中的不足。通过引入复杂权重的位置信息，单层神经网络能够有效学习序列表示，实验结果表明其性能超越FlyVec，并与更大规模模型相当。

Comply: A Complex Weight Learning Approach for Sentences Inspired by Drosophila Olfaction

BriefGPT - AI 论文速递 ·

初学者必懂的六个语言模型概念

初学者必懂的六个语言模型概念

MachineLearningMastery.com ·

本研究提出了一种基于参数化量子电路的复杂值词嵌入训练方法，性能与经典Skip-gram相当，且能有效扩展至大规模词汇，为量子自然语言处理开辟新方向。

Learning Complex Word Embeddings in Classical and Quantum Spaces

BriefGPT - AI 论文速递 ·

第9部分：构建自己的人工智能 - 自然语言处理（NLP）用于语言理解

第9部分：构建自己的人工智能 - 自然语言处理（NLP）用于语言理解

DEV Community ·

本研究探讨了传统关键词方法在社会工作文本分析中的局限，提出词嵌入作为创新方法，能够更有效地捕捉文本的意义和关系，提升研究效率，揭示复杂数据模式，从而改善社会工作服务和干预效果。

词嵌入入门：用于社会工作文本分析的人工智能技术

BriefGPT - AI 论文速递 ·

大型语言模型的关键：词嵌入的数学理解

大型语言模型的关键：词嵌入的数学理解

KDnuggets ·