聆思CSK6大模型+AI交互多模态开源SDK介绍
原文中文,约2100字,阅读约需5分钟。发表于: 。本示例工程中默认启用了坐姿检测功能,当摄像头识别到不良坐姿时,开发板上也将闪烁红色 LED 进行提醒,同时,我们也可通过 PC 工具查看实时拍摄的图像与坐姿检测结果。本示例运行时,摄像头将持续拍摄图像并并送入坐姿检测算法进行处理,当检测到画面中出现不良坐姿(如趴桌、手托脸等)时,将闪烁红色 LED 进行提醒,如下图。,可通过唤醒词 —— “小美小美” 对设备进行唤醒,当听到 “在呢”...
视觉语音大模型AI开发套件是围绕CSK6011A芯片设计的开发板,采用Zephyr RTOS作为操作系统,提供了多种开源SDK,包含语音交互、拍照识图、文生图、人脸识别等功能。支持按键交互和语音唤醒两种交互方式,可通过唤醒词“小美小美”进行唤醒。还支持拍照识图、图片生成和设备控制等功能。同时具备智能问答和坐姿检测功能。