词向量是如何来的? - 蝈蝈俊
原文中文,约3000字,阅读约需8分钟。发表于: 。词向量是自然语言处理(NLP)中的一个重要概念,它是将词语转换成计算机能理解的数值形式的方法。 图:现实世界的图书、文字会被映射成计算机世界的向量。 简单来说,词向量就是将每个词表示为一个实数向量,使得这些向量能够捕捉词语之间的含义和语义关系。 词向量发展历程 简单来说,进化历程如下: 对比如下表:
词向量是将词语转换成计算机能理解的数值形式的方法,能够根据词与词之间的共现关系学习得到每个词的向量表示。深度学习框架下的语言模型能够学习到上下文相关的词向量,这些向量不仅反映了词语的固有意义,还包含了特定上下文中的语义信息。词向量的应用场景包括文本分类、信息检索、机器翻译、聊天机器人、语义分析和文本生成。OpenAI推荐的获取词向量接口会返回1536维的向量。