小红花·文摘

本研究提出了一种基于WavLM特征的分类器，能够从语音中预测说话者的年龄、性别、母语、教育和国家等人口特征。该方法实现了年龄预测的平均绝对误差为4.94，性别分类准确率超过99.81%，显著提高了预测精度。

Demographic Attributes Prediction from Speech Using WavLM Embeddings

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，解决流式多说话人语音翻译中的说话人变化检测与性别分类问题。通过引入说话人嵌入，实验结果表明该方法在准确性上表现优异，具有重要应用价值。

Streaming Speaker Change Detection and Gender Classification in Transducer-Based Multi-Talker Speech Translation

BriefGPT - AI 论文速递 ·

使用VGG16进行面部性别识别

DEV Community ·

本文提出并实现了一个通用的卷积神经网络（CNN）构建框架，用于设计实时CNN。通过创建一个实时视觉系统来验证模型，在混合步骤中完成面部检测、性别分类和情感分类任务。准确性分别为96%和66%。介绍了最近的实时启用的引导反向传播可视化技术。通过在RoboCup＠Home比赛中使用的Care-O-bot 3机器人上部署进行验证。

基于 PyTorch 的卷积神经网络的面部情绪识别

BriefGPT - AI 论文速递 ·