凌陨心 ·

LLM微调实战，做自己的chatgpt (一）

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

华佗项目开源了经过中文医学指令微调的LLaMA-7B模型，通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集，提高了LLaMA在医疗领域的问答效果。详细介绍了环境搭建、权重下载、模型推理实验、Finetune、训练细节、模型效果对比、问题记录等内容。

🎯

🏷️

使用Scikit-LLM与开源语言模型
本文介绍如何使用Ollama本地托管的开源语言模型（如Llama 3、Mistral和Gemma）进行文本分类，避免支付API费用。内容包括Ollama的...
[折扣代码] ChatGPT商业版向8个国家用户提供买1送1优惠至少开通2个席位
OpenAI推出ChatGPT商业版促销活动，用户开通两个席位可享买一送一优惠。该服务支持八个国家，价格从18英镑到25美元不等，印度区价格最低，约134...
OpenAI合并ChatGPT和Codex，AI超级App路线浮出水面！
OpenAI合并了ChatGPT和Codex，推出了AI超级App，Codex用户已超过500万，其中20%为非开发者。新功能包括角色插件、网站和批注，旨...
LLM网关模式：每个基于Kubernetes的AI应用为何都需要它
LLM网关模式是一种架构方法，通过集中代理服务管理所有LLM API流量，解决了安全、成本和可见性问题。它简化了API密钥管理、请求路由和故障处理，提升了...
h5i Radio – 利用 Git，让 Claude 和 Codex 进行实时对话
h5i 是一个开源工具，支持多个 AI Agent（如 Claude 和 Codex）通过 Git 协作。其 Agent Radio 功能利用 Git 仓...
Inserting in Two Tables in a Single Round-Trip with JSON Duality Views in MySQL 9.7
A few months ago, I was asking myself how to insert in two tables in a single...