小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
延迟融合:将大语言模型集成到端到端语音识别的首次解码中

本文提出了一种高效的端到端自动语音识别解码方法,针对大语言模型在解码中的计算成本和词汇不匹配问题,采用“延迟融合”策略,减少LLM推理调用次数,从而提升解码速度和准确性。

延迟融合:将大语言模型集成到端到端语音识别的首次解码中

Apple Machine Learning Research
Apple Machine Learning Research · 2025-01-18T00:00:00Z
使用Testcontainers和Python进行Kubernetes端到端测试

使用Testcontainers简化Kubernetes应用测试,提供轻量级容器模拟集群及依赖。通过testcontainers-python库,可以进行端到端测试,确保应用在Kubernetes中的行为符合预期。

使用Testcontainers和Python进行Kubernetes端到端测试

The New Stack
The New Stack · 2024-12-12T18:00:21Z
云原生平台的端到端安全

云原生平台越来越受欢迎,但面临安全挑战。实施端到端安全至关重要,涵盖基础设施、容器、Kubernetes、应用和数据,能够提升安全性、增强合规性、提高业务灵活性并降低成本。

云原生平台的端到端安全

DEV Community
DEV Community · 2024-11-29T21:05:24Z
具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

自变量机器人(X Square)是国内唯一采用端到端统一大模型技术的公司,其正在训练的WALL-A模型在多个维度上超越了Physical Intelligence,能够处理复杂任务如拉拉链和折衣服,展现出强大的泛化能力。创始团队认为,端到端和统一模型是解决机器人操作问题的关键,未来有望推动机器人技术的重大突破。

具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

机器之心
机器之心 · 2024-11-07T06:41:00Z

本研究提出了一种新型端到端口语评估系统,不仅关注发音和流利度,还通过大型语言模型提升语法和词汇评估。结果显示,结合自定义语言模型的系统在语法评估上优于现有技术。

使用大型语言模型的口语语法评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本研究提出了一种利用对话上下文信息提升语音识别性能的模型,在Switchboard语料库上的测试优于传统方法。

针对口语对话系统的预测语音识别与话语结束检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本研究提出了一种端到端的灵活层次车道检测器,能在复杂视觉条件下实现高精度的3D车道检测。该方法利用层次网络预测车道形状的灵活表示,同时收集全局语义信息并避免局部误差。实验结果显示,该方法在高精度标准下优于现有顶尖方法,具有潜在的实际应用影响。

基于层次形状匹配的灵活3D车道检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z
最晚明年上半年落地L3:理想端到端自动驾驶,性能大幅提升

理想汽车发布第三代自动驾驶技术架构,采用端到端+视觉语言模型+世界模型的方法,提高AI的信息处理效率和对复杂路况的应对能力。该架构受到诺贝尔奖得主丹尼尔·卡尼曼的快慢系统理论启发,模拟人类的思考和决策过程。理想汽车已全面切入端到端+大模型方案,让车辆能够理解复杂路况和交通规则。他们利用用户数据进行训练和验证,提高系统的能力上限和迭代速度。下半年实现端到端+视觉语言模型的自动驾驶量产交付是他们的下一个目标。

最晚明年上半年落地L3:理想端到端自动驾驶,性能大幅提升

机器之心
机器之心 · 2024-08-06T10:18:20Z

该论文提出了一种新颖的资源高效方法,利用已训练的自动语音识别模型进行视觉语音识别。该方法通过提取知识,在标准测试中以极少的资源实现了竞争性的性能。词错误率在微调后分别降至35%(LRS2)和45.7%(LRS3)。该模型训练时间短,能够在老旧硬件上实时进行端到端的视觉语音识别。

MSRS: 用稀疏掩码优化从零开始训练多模态语音识别模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

本研究提出了一种融合内部线段切分和门控卷积层编码器的段落识别系统,使用词束搜索解码器后处理,准确率较高。

GatedLexiconNet:一种全面的端到端手写段落文本识别系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-22T00:00:00Z

本文提出了一种基于未来预测的成功或失败分类方法,通过端到端的方式确定行动计划能否完成给定任务。该方法利用了长时程的未来预测方法和过渡一致性正则化术语,并通过分类和机器人操作实验验证了其有效性。

长期机器人任务的未来预测性成功或失败分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-04T00:00:00Z

FaceXformer是一个端到端的统一变换器模型,用于综合范围的面部分析任务。它利用基于变换器的编码器-解码器架构,将多个任务集成到一个框架中,并提出了一个参数高效的解码器FaceX,用于学习通用和鲁棒的面部表示。在多个基准测试中,FaceXformer表现出色,并且对来自“野外”的图像也具有鲁棒性和普适性。

FaceXFormer:面部分析的统一 Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

自主驾驶中,多模态图像融合和目标检测至关重要。研究提出了一种新的端到端多模态融合检测算法EfficientMFD,只需一次训练步骤即可展现良好性能。在多个数据集上测试,展现出优于其他方法的融合效果和检测性能。

高效多模态同步融合检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-14T00:00:00Z

本文提出了一种基于LSTM网络的端到端视觉语音识别系统,取得了最先进的分类性能。在OuluVS2数据库上比基准提高了9.7%,在CUAVE数据库上比其他类似方法的系统提高了1.5%。

基于注意力长短期记忆 (LSTM) 的语音可懂度自动分类系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-05T00:00:00Z

本文介绍了一种新的端到端语音情感识别系统,利用共同关注机制和多层声学信息。实验证明该系统在IEMOCAP数据集上表现出竞争性能。

MF-AED-AEC: 利用多模态融合、ASR 错误检测和 ASR 错误修正进行语音情感识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-24T00:00:00Z

本文介绍了一种基于约束编程和强化学习的端到端解决调度问题的方法,通过神经网络架构和训练算法,在七个JSSP数据集上展示了比静态PDRs和CP求解器更高质量的解决方案。

港口火车卸货调度的约束规划模型:扩展

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-21T00:00:00Z

本技术报告介绍了LongViT,一种能够以端到端方式处理十亿像素图像的视觉Transformer。通过将图像分割成补丁并进行线性投影,使用LongNet对极长序列进行建模,生成捕捉了短程和长程依赖关系的表示。实验结果表明,LongViT在癌症诊断和预后方面优于先前的方法。

当一张图像价值 1,024 x 1,024 个词:计算病理学案例研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-06T00:00:00Z

该研究提出了一种端到端的定向目标检测器,结合了旋转RoI注意力和选择性不同查询技术,能够有效解决遥感图像中多方向、不同尺度、密集分布的目标实例的检测问题。通过交叉注意机制,能够聚焦定向感兴趣区域并对多尺度特征进行对齐。实验证明该方法在多个数据集上取得了最先进的性能。

遥感图像中端到端定向目标检测的高效解码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z

该研究探讨了经过语料库特殊增强后的端到端语音到文本翻译,研究了没有源语言转录和仅提供源语言转录的情况。实验结果表明,可以训练出紧凑高效的模型,并提供语料库,希望未来的研究能够挑战该语音翻译基线模型。

引入一个接口用于无障碍的访谈转录

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-18T00:00:00Z

该文章介绍了一种基于手绘草图的3D建模方法,采用端到端的方式,引入了轻量级生成网络和结构感知对抗训练,并通过Stroke Enhancement Module(SEM)捕捉结构信息,提升性能。实验证明该方法在合成和真实数据集上具有最先进的性能。

Deep3DSketch+: 从单个手绘草图快速进行三维建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-22T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码