法律法规数据向量化 - 蝈蝈俊
💡
原文中文,约800字,阅读约需2分钟。
📝
内容提要
该项目将中国法律法规数据向量化并接入ChatGPT,实现自然语言问答。但对于复杂案例场景,回答效果不佳,建议接入更多案例。使用时需拆分文章为每一节,使用Embedding将查询内容变成向量,执行相似性搜索,注入OpenAI的Completion文本自动补全接口。项目采用文本补全接口而非ChatCompletion接口。
🎯
关键要点
- 该项目将中国法律法规数据向量化并接入ChatGPT,实现自然语言问答。
- 对于复杂案例场景,回答效果不佳,建议接入更多案例。
- 接入向量数据库需通过OpenAI的Embedding接口获得文本的向量表示。
- 使用时需拆分文章为每一节,并将查询内容转化为向量。
- 使用流程包括将用户查询转化为向量、执行相似性搜索、注入到OpenAI的Completion接口。
- 使用OpenAI的Embedding时需注意版本更新可能导致向量变化。
- 选择文本补全接口而非ChatCompletion是因为法律咨询是一问一答的场景。
➡️