小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
电视的沙沙声

文章回忆了作者童年时对电视沙沙声的敏感,认为这是独特的能力。随着年龄增长,听觉和注意力的变化让他怀念那种丰富的感知。儿童的注意力更开放,而成年人则更专注于任务。作者希望在成年后仍能保持对世界的敏感。

电视的沙沙声

Another Dayu
Another Dayu · 2026-01-16T15:15:00Z

文章讨论了香薰蜡烛和香薰灯的优缺点,指出蜡烛需长时间点燃,容易浪费,而香薰灯则能快速释放香气,更加方便。作者还分享了拒接陌生电话和通过听书助眠的个人经验,强调生活的简化与效率。

基于嗅觉与听觉调控的四种生活舒适度提升方法研究与实践

Phuker's Blog
Phuker's Blog · 2025-11-25T14:00:00Z
AI 可穿戴听觉设备:从聆听设备到智能伴侣

SonicEdge首席执行官Moti Margalit表示,未来的可穿戴听觉设备将结合音频硬件、传感器和AI,具备理解能力,成为智能伴侣,能够感知和响应环境,实现个性化体验和健康监测。

AI 可穿戴听觉设备:从聆听设备到智能伴侣

实时互动网
实时互动网 · 2025-09-19T03:32:42Z
IndexTTS2:用极致表现力颠覆听觉体验

IndexTTS2是B站语音团队推出的新一代语音合成模型,优化了情感表达和时长控制。该模型通过“时间编码”机制解决了传统模型的时长控制问题,实现了音色与情感的解耦,并支持基于文本的情感调节。IndexTTS2在多项测试中表现优异,推动了零样本语音合成技术的实用化。

IndexTTS2:用极致表现力颠覆听觉体验

实时互动网
实时互动网 · 2025-07-11T06:57:49Z
Kardome 与 LG 电子合作利用空间听觉 AI 实现语音 UI 集成

Kardome与LG电子合作,将空间听觉AI技术应用于LG智能设备,提升嘈杂环境中的语音识别速度和准确性,推动产品创新。

Kardome 与 LG 电子合作利用空间听觉 AI 实现语音 UI 集成

实时互动网
实时互动网 · 2025-05-14T07:13:44Z
通过战略性听觉刺激提升认知表现

我研究了优化认知功能和工作效率的听觉工具,发现伽马波频率结合空间特征的白噪声和低音量合成波音乐,显著提升了专注力和工作流,推荐给需要提高认知表现的专业人士。

通过战略性听觉刺激提升认知表现

DEV Community
DEV Community · 2025-03-23T14:40:00Z

本研究解决了语言模型在处理需要听觉常识知识的任务时的不足。提出的“想象听觉”方法通过生成模型动态地生成听觉知识,避免了依赖外部音频数据库的问题。实验结果表明,该方法在AuditoryBench上达到了最先进的性能,展示了基于生成的有效性。

想象听觉:听觉知识生成可以有效辅助语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-21T00:00:00Z

本研究探讨了味觉与听觉的关系,提出了一种新型多模态生成模型,能够将味觉信息转化为音乐。实验结果表明,经过微调的生成音乐模型(MusicGEN)更能准确反映味觉描述,展示了人工智能在声音与味觉交互中的潜力。

Multimodal Symphony: Integrating Taste and Sound through Generative Artificial Intelligence

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z

本研究提出了一种基于意图的听觉场景理解(II-ASU)方法,开发了听觉注意力驱动的大型语言模型(AAD-LLM),通过脑电图数据解码听众关注的说话者,实验结果表明其在多说话者场景中的表现优于传统模型。

基于神经注意力驱动的听觉场景理解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z

本研究解决了传统人工神经网络在与人脑区域对齐方面的困难,提出了一种名为脑样听觉网络(BAN)的新模型,该模型结合了四个神经解剖映射区域及递归连接,并引入了一种新的评估标准——脑样听觉分数(BAS)。研究结果表明,BAN在音乐流派分类任务上表现出色,同时其BAS得分高,首次展现了与人脑听觉识别通路的相似性。

BAN:在人工神经网络与人脑皮层之间进行听觉识别的神经解剖对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-21T00:00:00Z

本研究提出MILS多模态迭代大型语言模型求解器,解决了传统模型对特定训练数据的依赖。MILS通过多步推理和无梯度优化,提升了零样本标注和文本到图像生成的效果,开启了跨模态运算的新应用。

大型语言模型无需训练即可实现视觉和听觉能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

本研究针对耳蜗植入设备在真实环境中语音分离效果不佳的问题,提出通过使用空间线索来提升分离质量的方案。核心发现表明,无论是隐式还是显式的空间线索,均能显著改善相近或空间分隔的说话者之间的语音分离效果,尤其在声谱线索模糊时表现尤为明显。这项工作对日常听觉场景中助听设备的改进具有重要影响。

利用耳蜗植入物麦克风的空间线索有效增强实际听觉场景中的语音分离

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-24T00:00:00Z

本研究提出了一种新方法,通过辅助音素预测器提升脑机接口在听觉语音解码中的表现,特别是对语音感知受损者,显示出优于传统方法的解码效果。

通过并行音素序列预测增强EEG中的听觉语音解码

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-08T00:00:00Z

本文提出了一种新型深度卷积自编码器(Skip-CAE),用于木材产品工业中的声学异常检测,旨在解决因技能劳动力短缺导致的设备故障问题。研究表明,该方法优于传统检测手段,显著提升了木材平整机的故障诊断能力,可能降低企业运营成本。

通过听觉进行计划:用于工业木材平整机的声学异常检测的卷积神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-08T00:00:00Z

本研究提出了新的深度学习工具包autrainer,旨在克服计算听觉任务训练框架的局限性。该工具包基于PyTorch,支持低代码训练,提升训练效率。

autrainer:一个模块化和可扩展的深度学习工具包用于计算听觉任务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

本研究针对视频到音频生成任务中的可控性不足问题,提出了一种新的多模态生成框架VATT。该框架通过引入文本提示,使得音频生成过程更具精确性,并能够根据视频生成音频描述,展现了在性能和用户偏好方面的显著改善,拓展了视频与音频交互的应用潜力。

从视觉内容看听觉信息——视频到音频的生成与文本结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-08T00:00:00Z

本研究提出了一种统一的训练策略,解决了听觉、视觉和视听语音识别的独立性问题。通过贪婪伪标签方法,利用未标记样本提升模型性能,达到了最新技术水平。

统一语音识别:一种用于听觉、视觉和视听输入的单一模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

论文提出了一种新的浅-深注意力网络(SDANet)用于EEG信号分类。通过注意力相关模块(ACM)发现听觉语音与EEG信号的关系,并使用浅-深相似性分类模块(SDSCM)进行分类。多种训练策略和数据增强提高了模型的鲁棒性。实验结果表明,在Auditory EEG challenge数据集上,SDANet优于基线模型。

DARNet:具有时空构建的双重注意力细化网络用于听觉注意力检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

本研究通过微调听觉大型语言模型,解决了传统语音质量评估需多方面评分的问题。模型可预测平均意见分数、说话者相似度,并进行A/B测试和生成自然语言描述。实验显示,该模型在语音质量预测上与先进小型模型相当,且在A/B测试和自然语言描述中表现良好。

启用听觉大型语言模型进行自动语音质量评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本文介绍了一个自动语音识别后处理模型,使用元数据构建任务特定的数据集,并通过两阶段训练策略微调RoBERTa预训练模型。测试结果显示,该模型在可读性感知WER上比基线模型提高了13.26%,在BLEU度量上提高了17.53%。人类评估证明该方法生成的转录本比基线更易读。

为视觉而录,不为听觉而回响:上下文化的自动语音识别转录文本转写

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码