近期LLM的部署与应用经历

💡 原文中文,约3300字,阅读约需8分钟。
📝

内容提要

作者探讨了DeepSeek的应用与部署,分享了硬件选择和软件配置的搭建过程。尽管面临一些挑战,作者对DeepSeek的市场潜力持乐观态度,认为未来将继续优化和应用。

🎯

关键要点

  • 作者探讨了DeepSeek的应用与部署,分享了硬件选择和软件配置的搭建过程。
  • DeepSeek在国内市场非常火,百度的使用体验最好。
  • 作者选择自行搭建DeepSeek,考虑到成本和接口连接问题。
  • 购买了RTX4090显卡以提高DeepSeek的运行速度,但蒸馏模型效果不佳。
  • 清华大学的KTransformers框架提升了DeepSeek的性能,作者计划升级硬件以支持更好的模型。
  • 知识库的构建是DeepSeek应用的关键,作者使用MaxKB作为向量数据库。
  • MaxKB的社区版限制创建应用数量,作者对这种限制表示不满。
  • 作者通过修改代码绕过MaxKB的限制,认为开源软件应更开放。
  • Cherry Studio是一个更方便的桌面软件,适合个人用户使用。
  • 总体来看,DeepSeek的市场潜力被看好,尽管面临一些挑战,作者对未来持乐观态度。

延伸问答

DeepSeek的市场表现如何?

DeepSeek在国内市场非常火,尤其是百度的使用体验最好,其他公司的可用性和速度较差。

作者选择自行搭建DeepSeek的原因是什么?

作者认为接入其他公司的接口成本较高,且需要的应用可能无法连接这些接口,因此选择自行搭建。

使用DeepSeek时遇到的主要技术挑战是什么?

作者遇到的挑战包括蒸馏模型效果不佳,逻辑错误频繁,以及MaxKB社区版限制创建应用数量。

KTransformers框架对DeepSeek的性能提升有何影响?

KTransformers框架可以利用Intel的AMX指令集,使DeepSeek-R1的运行速度提升到可用级别。

MaxKB的社区版存在哪些限制?

MaxKB的社区版限制只能创建五个应用,作者对此表示不满,认为开源软件应更开放。

Cherry Studio与MaxKB相比有什么优势?

Cherry Studio更适合个人用户,安装方便,功能上可能不如MaxKB强大,但处理文档和添加知识库更简单。

➡️

继续阅读