标签

 编码器 

相关的文章:

这是一个关于编码器在数据稀缺情况下精准肿瘤分割以及视觉-语言模型的列表页,包含了多篇相关文章的内容。

揭示无编码器的视觉 - 语言模型

原文约400字,阅读约需1分钟。发表于:

在这项研究中,我们提出了一种简单而有效的训练方法,实现了没有视觉编码器的纯视觉语言模型,并通过桥接视觉语言表示和增强视觉识别能力的策略推出了 EVE 模型,它在多个视觉语言基准测试中显著优于采用类似容量的基于编码器的 VLMs。

该研究提出了一种名为BRAVE的方法,通过整合多个冻结的编码器的特征来改善视觉语言模型(VLM)的性能。BRAVE在字幕生成和视觉问答任务上表现出最先进的性能,同时需要更少的可训练参数和更紧凑的表示。研究结果显示了将不同的视觉偏差纳入VLM的潜力。

相关推荐 去reddit讨论

鉴别性哈密顿变分自编码器在数据稀缺情况下精准肿瘤分割

原文约300字,阅读约需1分钟。发表于:

通过提出基于 Hamiltonian 变分自动编码器(HVAE)和区别性正则化的新的端到端混合架构,我们的方法可以准确估计图像和蒙版的联合分布,从而生成具有较少伪影和离群实例的逼真医学图像。通过在丰富增强的数据集上以切片方式操作,我们的架构可以快速且准确地分割 3D 体积,在 BRATS(MRI 模态)和 HECKTOR(PET...

通过提出基于Hamiltonian变分自动编码器(HVAE)和区别性正则化的新的端到端混合架构,研究人员成功地生成了逼真的医学图像。他们的方法可以准确估计图像和蒙版的联合分布,从而减少了伪影和离群实例。实验证明,这种方法在有限数据的不同医学成像模态上是有效的。

相关推荐 去reddit讨论

OLGA:一种单类图自编码器

发表于:

OLGA 是一种端到端的图节点表示学习方法,通过结合两个损失函数来封装感兴趣的实例,其中包括一个新的超球面损失函数,以改善模型学习。OLGA 通过学习低维表示来保持分类性能,并提供了可解释的模型表示学习和结果。

相关推荐 去reddit讨论

编码器内部的语言转换:关于零翻译多语言中的表示转换

原文约400字,阅读约需1分钟。发表于:

这篇论文通过研究多语言神经机器翻译中的表示转移,揭示了导致零射翻译不足的表示问题。研究中引入了身份对(一个句子翻译为自身),以解决多语言研究中基准测量缺失的问题,因为身份对代表了所有语言转移中的最佳表示状态。通过分析,我们证明编码器将源语言转移到目标语言的表示子空间,而不是语言无关的状态。因此,零射翻译不足是因为表示与其他语言相混合并且未能有效地转移到目标语言。基于我们的发现,我们提出了两种...

该论文研究了多语言神经机器翻译中的表示转移问题,提出了两种方法来改善零射翻译的性能,并在实验中取得了显著的改善。

相关推荐 去reddit讨论

优化多重口吃语音分类:利用 Whisper 的编码器实现自动评估中高效参数减少

原文约300字,阅读约需1分钟。发表于:

通过使用先进的语音识别模型 Whisper 以及 6 层编码器的不同层冻结策略,本研究提出了一种计算高效的模型配置来更有效地对多发性口吃语音进行自动分类,取得了显著的性能,同时发现最后一个编码器层在辨别口吃性不流畅语音方面的贡献,使模型适用于多种方言和语言。

本文提出了一种基于LSTM的多任务模型,用于增量检测口吃结构。该模型在Switchboard对话行为语料库上训练,并在SWDA上表现优异。同时,在bAbI+数据集上评估结果显示该模型具有很好的泛化潜力。

相关推荐 去reddit讨论

使用双编码器 - 解码器网络进行息肉和手术仪器分割

发表于:

本文描述了在 MedAI 竞赛中解决问题的方法,参赛者需要从内窥镜图像中分割息肉和手术器械。我们的方法依赖于一个双编码器 - 解码器神经网络,该网络在之前的息肉分割研究中已经应用过,但做出了一系列增强:更强大的编码器架构,改进的优化过程以及基于温和模型集成的分割后处理。实验结果表明,我们的方法产生的分割结果与医学专家提供的手工分割结果具有良好的一致性。

相关推荐 去reddit讨论

对比稀疏自编码器解释国际象棋智能体的规划

发表于:

基于对对局轨迹的对比稀疏自编码器(CSAE)提取和解释对国际象棋代理计划有意义的概念,通过定性分析 CSAE 特性并提出自动特性分类法,进一步利用合理性检查评估算法的质量。

相关推荐 去reddit讨论

InceptionV1 早期视觉中缺失的曲线检测器:应用稀疏自编码器

发表于:

应用稀疏自编码器 (SAEs) 于卷积神经网络的早期视觉层,发现 SAEs 可以揭示从单个神经元中难以察觉的新的可解释特征,包括填补之前空白的额外曲线检测器,并将一些多义性神经元分解为更具单一语义的组成要素,这些发现表明 SAEs 是理解 InceptionV1 及卷积神经网络的有价值工具。

相关推荐 去reddit讨论
相关推荐 去reddit讨论

利用时间卷积自编码器推断动力系统的时变耦合

发表于:

通过对复杂动态系统中非线性和非平稳性交互的评估,我们引入了用于因果推断的时间自编码 (TACI) 方法,该方法结合了一种新的代理数据度量因果交互和一种新的双头机器学习架构来识别和测量时间变化的因果交互的方向和强度。通过对合成数据集和实际数据集的测试,我们证明了 TACI...

相关推荐 去reddit讨论