分享AI芯片开发经验 ·

【多模态大模型开发】使用智谱AI替换聆思开发板自带的图片识别能力

💡 原文中文，约8100字，阅读约需20分钟。

📝

内容提要

本文介绍了如何结合智谱AI和聆思开发套件进行项目开发，包括创建本地智谱AI应用、安装SDK、编写查询火车票的代码、搭建Django后端、开发图片识别功能以及项目云端部署，实现语音交互功能。整体过程简单易上手，适合开发者体验。

🎯

关键要点

创建本地智谱AI应用，安装SDK并编写查询火车票的代码。
创建聆思大模型平台应用，测试环境并将聆思与智谱AI结合。
使用Django搭建后端，将智谱项目部署到云端，实现API接口。
开发图片识别功能，使用智谱AI SDK进行图片内容识别。
项目重构，整合用户语音输入与图片识别功能，优化后端代码。
后端部署在阿里云，进行项目编排与设备绑定，完成语音交互功能。

❓

延伸问答

如何创建本地智谱AI应用？

可以通过安装SDK并编写查询火车票的代码来创建本地智谱AI应用。

如何将智谱AI与聆思开发套件结合？

需要创建聆思大模型平台应用，并修改代码以整合智谱AI和聆思。

如何使用Django搭建后端？

可以通过创建Django项目和应用，并配置路由来搭建后端。

如何开发图片识别功能？

使用智谱AI SDK进行图片内容识别，并通过API接口获取图片信息。

项目如何部署到云端？

可以将智谱的项目通过Django部署到云端，如腾讯云或阿里云。

如何实现语音交互功能？

整合用户语音输入与图片识别功能，并优化后端代码以支持语音交互。

🏷️

标签

Django ai 图片识别大模型智谱智谱AI 聆思开发套件语音交互

➡️

继续阅读

WorkBuddy重大升级，AI时代的Office来了
WorkBuddy已成为国内最受欢迎的效率智能体工具之一
字节跳动AI业务组织调整；朱一明减持兆易创新套现44亿元；三星电子半导体业务季度营业利润增长逾250倍 | 日报
（全球TMT 2026年07月30日讯）今日要点：字节跳动AI业务组织调整；朱一明减持兆易创新套现44亿元；月 […]
互联网时代的话题是「连接」，AI时代的话题是「执行」
2013年开始，OTO成为互联网的主要逻辑，随着微信、各类App成为互联网入口的主流，人们对互联网的认知逐渐达到顶峰，最后提炼出两个字：连接。在移动互联网...
AI长上下文阅读124页后仅36%合规，注意力越长规矩越崩
顶级AI在长上下文里塞进124页公司手册后只拿36分，剩下64分全栽在看见规则却偏要硬刚上，长窗口反而成了帮凶？新出的Handbook.md测试集专门测...
大学教授出奇招抓AI作弊，35名学生32人中招
7月28日消息，据科技媒体TechSpot昨天报道，美国奥尔康州立大学历史学教授杰森 · 吉布森（Jason Gibson）最近分享自己抓 AI 作弊的奇...
HBO Max新增AI驱动的发现功能，包括Shorts和对话式搜索
华纳兄弟探索频道正在为 HBO Max 引入全新的 AI 驱动的内容发现工具，包括垂直视频流和对话式搜索体验，旨在帮助订阅用户更轻松地找到节目。首个功能...