内容提要
本文介绍了10个Python一行代码示例,用于调用大型语言模型(LLM),包括云端API(如OpenAI、Anthropic、Google Gemini等)和本地模型(如Ollama、LM Studio、vLLM)。每个示例附有简要说明和官方文档链接,帮助用户快速实现LLM调用,提升开发效率。
关键要点
- 本文介绍了10个Python一行代码示例,用于调用大型语言模型(LLM)。
- 示例包括云端API(如OpenAI、Anthropic、Google Gemini等)和本地模型(如Ollama、LM Studio、vLLM)。
- 每个示例附有简要说明和官方文档链接,帮助用户快速实现LLM调用。
- 在使用之前,需要安装必要的包并设置API密钥为环境变量。
- 云端API示例包括OpenAI GPT、Anthropic Claude、Google Gemini、Mistral和Hugging Face。
- 本地模型示例包括Ollama、LM Studio和vLLM,强调了隐私和控制的优势。
- 提供了流式响应和异步调用的技巧,以提高工作效率。
- 每个代码示例都可以扩展为函数或命令行工具,适用于生产环境。
延伸问答
如何使用Python调用OpenAI的GPT模型?
可以使用以下代码:from openai import OpenAI; print(OpenAI().chat.completions.create(model='gpt-4o-mini', messages=[{'role':'user','content':'Explain vector similarity'}]).choices[0].message.content)
在使用大型语言模型之前需要做哪些准备?
需要安装必要的包并设置API密钥为环境变量,例如使用命令export OPENAI_API_KEY='sk-...'。
本地模型与云端API的主要区别是什么?
本地模型提供隐私和控制,避免网络延迟,而云端API则更易于使用,无需担心GPU内存。
如何实现流式响应以提高用户体验?
可以使用OpenAI的stream=True参数,实时打印生成的每个token,例如:from openai import OpenAI; [print(c.choices[0].delta.content or '', end='') for c in OpenAI().chat.completions.create(model='gpt-4o-mini', messages=[{'role':'user','content':'Stream a poem'}], stream=True)]。
如何在Python中进行异步API调用?
可以使用httpx库进行异步调用,例如:import asyncio, httpx; print(asyncio.run(httpx.AsyncClient().post('https://api.mistral.ai/v1/chat/completions', headers={'Authorization':'Bearer TOKEN'}, json={'model':'mistral-tiny','messages':[{'role':'user','content':'Hello'}]})).json()['choices'][0]['message']['content'])。
如何使用Hugging Face的Inference API?
可以通过发送POST请求调用Hugging Face模型,例如:import requests; print(requests.post('https://api-inference.huggingface.co/models/mistralai/Mistral-7B-Instruct-v0.2', headers={'Authorization':'Bearer YOUR_HF_TOKEN'}, json={'inputs':'Write a haiku about data'}).json()[0]['generated_text'])。