10个Python一行代码示例,用于调用大型语言模型(LLM)

10个Python一行代码示例,用于调用大型语言模型(LLM)

💡 原文英文,约1700词,阅读约需7分钟。
📝

内容提要

本文介绍了10个Python一行代码示例,用于调用大型语言模型(LLM),包括云端API(如OpenAI、Anthropic、Google Gemini等)和本地模型(如Ollama、LM Studio、vLLM)。每个示例附有简要说明和官方文档链接,帮助用户快速实现LLM调用,提升开发效率。

🎯

关键要点

  • 本文介绍了10个Python一行代码示例,用于调用大型语言模型(LLM)。
  • 示例包括云端API(如OpenAI、Anthropic、Google Gemini等)和本地模型(如Ollama、LM Studio、vLLM)。
  • 每个示例附有简要说明和官方文档链接,帮助用户快速实现LLM调用。
  • 在使用之前,需要安装必要的包并设置API密钥为环境变量。
  • 云端API示例包括OpenAI GPT、Anthropic Claude、Google Gemini、Mistral和Hugging Face。
  • 本地模型示例包括Ollama、LM Studio和vLLM,强调了隐私和控制的优势。
  • 提供了流式响应和异步调用的技巧,以提高工作效率。
  • 每个代码示例都可以扩展为函数或命令行工具,适用于生产环境。

延伸问答

如何使用Python调用OpenAI的GPT模型?

可以使用以下代码:from openai import OpenAI; print(OpenAI().chat.completions.create(model='gpt-4o-mini', messages=[{'role':'user','content':'Explain vector similarity'}]).choices[0].message.content)

在使用大型语言模型之前需要做哪些准备?

需要安装必要的包并设置API密钥为环境变量,例如使用命令export OPENAI_API_KEY='sk-...'。

本地模型与云端API的主要区别是什么?

本地模型提供隐私和控制,避免网络延迟,而云端API则更易于使用,无需担心GPU内存。

如何实现流式响应以提高用户体验?

可以使用OpenAI的stream=True参数,实时打印生成的每个token,例如:from openai import OpenAI; [print(c.choices[0].delta.content or '', end='') for c in OpenAI().chat.completions.create(model='gpt-4o-mini', messages=[{'role':'user','content':'Stream a poem'}], stream=True)]。

如何在Python中进行异步API调用?

可以使用httpx库进行异步调用,例如:import asyncio, httpx; print(asyncio.run(httpx.AsyncClient().post('https://api.mistral.ai/v1/chat/completions', headers={'Authorization':'Bearer TOKEN'}, json={'model':'mistral-tiny','messages':[{'role':'user','content':'Hello'}]})).json()['choices'][0]['message']['content'])。

如何使用Hugging Face的Inference API?

可以通过发送POST请求调用Hugging Face模型,例如:import requests; print(requests.post('https://api-inference.huggingface.co/models/mistralai/Mistral-7B-Instruct-v0.2', headers={'Authorization':'Bearer YOUR_HF_TOKEN'}, json={'inputs':'Write a haiku about data'}).json()[0]['generated_text'])。

➡️

继续阅读