小红花·文摘

一种变分框架，用于提高生成语音语言模型的自然性

Apple Machine Learning Research ·

本研究系统综述了离散语音标记在语音生成中的应用，提出了新的分类视角，比较了声学与语义标记的优缺点，发现其在大型语言模型中的兼容性良好，并为未来研究提供了建议。

离散语音标记的最新进展：综述

BriefGPT - AI 论文速递 ·

本研究探讨了多语言模型中子词共享语义的作用，提出通过合并语义相似的子词形成“语义标记”。结果显示，使用语义标记的模型在多种任务中表现优异，尤其在分类任务中，强调了子词级别共享语义在跨语言迁移中的重要性。

Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models

BriefGPT - AI 论文速递 ·

语义标记是使用HTML元素来清晰描述其含义，提高代码的SEO优化和用户友好性。它还可以提高代码的可读性，改善用户体验，并被屏幕阅读器广泛使用。

什么是语义标记？~ 游戏开发挑战

DEV Community ·

本文探讨了语义标记的最佳配置及其在音频应用中的性能提升，提出了SpeechTokenizer用于语音大型语言模型的训练。研究表明，儿童语音识别系统的性能接近传统方法，且参数减少约83%。此外，介绍了关键词检测系统的数据集及其挑战，并提出了TokenSplit模型用于语音分离，展示了其在分离和转录任务中的优越性能。

DASB -- 离散音频和语音基准

BriefGPT - AI 论文速递 ·

D-iGPT是对image-GPT的改进方法，通过将预测目标转移到语义标记上，实现对视觉内容的高级理解。D-iGPT在ImageNet-1K数据集上取得了令人瞩目的成绩，并在下游任务中表现出较强的泛化能力和鲁棒性。

强大的视觉表达学习者：重塑 Image-GPT

BriefGPT - AI 论文速递 ·