从0到1的ChatGPT - 进阶篇(五)- Embeddings
原文中文,约3900字,阅读约需10分钟。发表于: 。在前面的文章中,无论是各种prompt技巧,又或者是对话技巧,更或者是各种数据集训练,都逃不开两个致命的问题。 1、ChatGPT只能处理文字 2、无论是上下文参考,还是单条对话都有token限制 所以在ChatGPT中,很多应用方向遇到的第一个问题就是如何把问题用文字的方式描述出来,其中最典型的场景就是代码分析。 所以ChatGPT也鼓励使用Embeddings来做类似搜索、分类或者异常检...
使用Embeddings将问题和内容向量化,通过计算余弦相似度找到最相似的文章段落。openai的API可计算Embeddings向量,但在代码分析中表现不佳。