分享AI芯片开发经验 ·

在一块开发板上同时实现大模型语音交互和视觉识别

💡 原文中文，约2400字，阅读约需6分钟。

📝

内容提要

聆思CSK6视觉语音大模型开发板提供了摄像头/麦克风/扬声器/屏幕/网络模组等硬件资源，适合视觉类、语音类应用开发。支持语音唤醒、坐姿检测、人脸识别、物体分类等AI能力。开发套件可联网进行大模型语音交互和视觉识别。使用type-c数据线连接电脑和开发板，打开串口日志调试工具，输入WiFi指令联网。开发套件还可使用其他AI能力，如单词评测。

🎯

关键要点

聆思CSK6视觉语音大模型开发板适合视觉类和语音类应用开发，提供丰富的硬件资源。
开发板使用聆思 CSK6011A 芯片，集成摄像头、麦克风、扬声器、屏幕等外设。
支持多模态应用示例，快速上手体验大模型语音交互和智能视觉。
开发板配备DAPLINK调试器，支持烧录、调试和串口日志查看。
支持的AI能力包括语音唤醒、坐姿检测、人脸识别、物体分类等。
开发板可通过type-c数据线连接电脑，使用串口日志调试工具进行调试。
联网指令包括wifi connect、wifi disconnect等，支持WiFi网络连接和管理。
开发套件接入网络后，可以使用唤醒词进行大模型语音交互。
坐姿检测算法通过摄像头拍摄的图片进行检测，并可通过CSK_USB接口传输数据。
开发套件支持更换SDK以使用其他AI能力，如单词评测，提供详细的操作步骤。

🏷️

在一块开发板上同时实现大模型语音交互和视觉识别

内容提要

关键要点

标签

继续阅读