小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
电视的沙沙声

文章回忆了作者童年时对电视沙沙声的敏感,认为这是独特的能力。随着年龄增长,听觉和注意力的变化让他怀念那种丰富的感知。儿童的注意力更开放,而成年人则更专注于任务。作者希望在成年后仍能保持对世界的敏感。

电视的沙沙声

Another Dayu
Another Dayu · 2026-01-16T15:15:00Z

文章讨论了香薰蜡烛和香薰灯的优缺点,指出蜡烛需长时间点燃,容易浪费,而香薰灯则能快速释放香气,更加方便。作者还分享了拒接陌生电话和通过听书助眠的个人经验,强调生活的简化与效率。

基于嗅觉与听觉调控的四种生活舒适度提升方法研究与实践

Phuker's Blog
Phuker's Blog · 2025-11-25T14:00:00Z
AI 可穿戴听觉设备:从聆听设备到智能伴侣

SonicEdge首席执行官Moti Margalit表示,未来的可穿戴听觉设备将结合音频硬件、传感器和AI,具备理解能力,成为智能伴侣,能够感知和响应环境,实现个性化体验和健康监测。

AI 可穿戴听觉设备:从聆听设备到智能伴侣

实时互动网
实时互动网 · 2025-09-19T03:32:42Z
IndexTTS2:用极致表现力颠覆听觉体验

IndexTTS2是B站语音团队推出的新一代语音合成模型,优化了情感表达和时长控制。该模型通过“时间编码”机制解决了传统模型的时长控制问题,实现了音色与情感的解耦,并支持基于文本的情感调节。IndexTTS2在多项测试中表现优异,推动了零样本语音合成技术的实用化。

IndexTTS2:用极致表现力颠覆听觉体验

实时互动网
实时互动网 · 2025-07-11T06:57:49Z
Kardome 与 LG 电子合作利用空间听觉 AI 实现语音 UI 集成

Kardome与LG电子合作,将空间听觉AI技术应用于LG智能设备,提升嘈杂环境中的语音识别速度和准确性,推动产品创新。

Kardome 与 LG 电子合作利用空间听觉 AI 实现语音 UI 集成

实时互动网
实时互动网 · 2025-05-14T07:13:44Z
通过战略性听觉刺激提升认知表现

我研究了优化认知功能和工作效率的听觉工具,发现伽马波频率结合空间特征的白噪声和低音量合成波音乐,显著提升了专注力和工作流,推荐给需要提高认知表现的专业人士。

通过战略性听觉刺激提升认知表现

DEV Community
DEV Community · 2025-03-23T14:40:00Z

本研究解决了语言模型在处理需要听觉常识知识的任务时的不足。提出的“想象听觉”方法通过生成模型动态地生成听觉知识,避免了依赖外部音频数据库的问题。实验结果表明,该方法在AuditoryBench上达到了最先进的性能,展示了基于生成的有效性。

想象听觉:听觉知识生成可以有效辅助语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-21T00:00:00Z

本研究探讨了味觉与听觉的关系,提出了一种新型多模态生成模型,能够将味觉信息转化为音乐。实验结果表明,经过微调的生成音乐模型(MusicGEN)更能准确反映味觉描述,展示了人工智能在声音与味觉交互中的潜力。

Multimodal Symphony: Integrating Taste and Sound through Generative Artificial Intelligence

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z

本研究解决了传统人工神经网络在与人脑区域对齐方面的困难,提出了一种名为脑样听觉网络(BAN)的新模型,该模型结合了四个神经解剖映射区域及递归连接,并引入了一种新的评估标准——脑样听觉分数(BAS)。研究结果表明,BAN在音乐流派分类任务上表现出色,同时其BAS得分高,首次展现了与人脑听觉识别通路的相似性。

BAN:在人工神经网络与人脑皮层之间进行听觉识别的神经解剖对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-21T00:00:00Z

本研究针对耳蜗植入设备在真实环境中语音分离效果不佳的问题,提出通过使用空间线索来提升分离质量的方案。核心发现表明,无论是隐式还是显式的空间线索,均能显著改善相近或空间分隔的说话者之间的语音分离效果,尤其在声谱线索模糊时表现尤为明显。这项工作对日常听觉场景中助听设备的改进具有重要影响。

利用耳蜗植入物麦克风的空间线索有效增强实际听觉场景中的语音分离

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-24T00:00:00Z

本研究提出了新的深度学习工具包autrainer,旨在克服计算听觉任务训练框架的局限性。该工具包基于PyTorch,支持低代码训练,提升训练效率。

autrainer:一个模块化和可扩展的深度学习工具包用于计算听觉任务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

本研究针对视频到音频生成任务中的可控性不足问题,提出了一种新的多模态生成框架VATT。该框架通过引入文本提示,使得音频生成过程更具精确性,并能够根据视频生成音频描述,展现了在性能和用户偏好方面的显著改善,拓展了视频与音频交互的应用潜力。

从视觉内容看听觉信息——视频到音频的生成与文本结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-08T00:00:00Z

本文介绍了一种新型基于transformer的框架,用于从EEG信号中提取注意状态,优化特征提取方法。该框架在多个数据集上表现优异,适用于注意力缺陷多动障碍(ADHD)评估和驾驶警觉度检测。研究提出的新模型SDANet和TAnet显著提高了EEG信号分类的准确性,具有广泛的应用潜力。

DARNet:具有时空构建的双重注意力细化网络用于听觉注意力检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

本研究提出了Quality-Net模型,能够在没有干净参考语音的情况下评估语音质量,实验结果表明其与PESQ高度相关。此外,探讨了大型语言模型在自动语音识别和语音合成中的应用,并提出了改进评估机制以提升自然语言处理模型的性能。

启用听觉大型语言模型进行自动语音质量评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本文介绍了多种语音增强和识别技术,包括Accordion Annealing(ACCAN)和InterAug等新训练方法,旨在提高语音识别系统在嘈杂环境中的鲁棒性。这些方法显著降低了词错误率,改善了语音质量,推动了语音识别技术的发展。

计算机听觉的音频增强——基于样本重要性的迭代训练范式

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

南卡Runner Pro 5是一款专为运动设计的骨传导耳机,具备防水防尘性能和舒适的佩戴感。耳机采用蓝牙5.4技术和第四代響科技,音质清晰细腻。耳机还具备防漏音技术和32G存储空间,可脱离手机使用。南卡的APP功能简洁实用。唯一的缺点是价格稍贵。

打造全新运动听觉体验,安全、舒适、高效的跑步耳机之选—南卡Runner Pro 5

熊猫不是猫QAQ
熊猫不是猫QAQ · 2024-08-05T10:08:15Z

本文探讨了Transformer模型在多说话者语音识别中的应用,实验结果显示其相对错误率显著降低。同时,提出了音频-视觉声音分离方案和基于多通道的ASR系统,均取得良好效果。研究还涉及语音分离模型的可转移性及其在低资源环境下的应用,展示了新架构在实时任务中的优势。

Papez: 基于听觉工作记忆的资源高效语音分离

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-01T00:00:00Z

通过物理启发嵌入网络和深度学习技术,我们提出了一种创新的多任务学习模型 PEMT-Net,用于增强多任务听觉信号解码性能,从而超越现有方法并为理解大脑处理复杂听觉信息的机制提供新的见解。

通过物理知识引导的多任务转换器的嵌入网络理解听觉诱发的脑信号

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-04T00:00:00Z

基于人类听觉系统的层次化处理,从低级声学特征到高级语义理解的转变,我们引入了一种新的粗到细的音频重建方法。利用非侵入式功能性磁共振成像(fMRI)数据,我们的方法模拟了听觉处理的逆向路径。通过初始使用 CLAP 将 fMRI 数据粗略解码到低维语义空间,然后通过语义特征引导进行精细解码到高维 AudioMAE...

逆转听觉处理路径:基于 fMRI 的由粗到细的音频重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z

MindGPT是一种基于fMRI信号的非侵入性神经解码器,结合视觉引导神经编码器和大型语言模型GPT进行语义解码。研究表明,高级视觉皮层在语言解码中比低级视觉皮层更具信息量。该模型的代码将公开发布,展示无创脑机接口在解码自然语言方面的潜力。

使用 fMRI 提示的 LLM 进行开放式词汇听觉神经解码

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码