小红花·文摘

本研究提出了一种新模型，结合卷积层和Transformer块，从表面肌电图信号中预测发音特征，相关性达到约0.9，并首次成功将预测特征解码为可理解的语音波形。

Prediction of Articulatory Features from Surface Electromyography in Speech Production

BriefGPT - AI 论文速递 ·

Apache TVM 是一个支持 CPU 和 GPU 的深度学习编译框架。本文介绍了如何使用 auto-scheduler 为 GPU 进行自动调度，用户只需编写计算声明，auto-scheduler 会自动生成调度方案。通过定义卷积层计算和创建搜索任务，用户可以优化深度学习模型的性能，并记录调度结果以便后续分析。

【TVM教程】为 GPU 自动调度卷积层

HyperAI超神经 ·

本文介绍了一种名为VidTok的开源视频标记器，旨在解决视频生成和理解中的像素级冗余问题。VidTok结合了卷积层和缩放模块等架构改进，并采用有限标量量化技术，显著提升了性能，优于现有方法。

VidTok: A Versatile Open-Source Video Tokenizer

BriefGPT - AI 论文速递 ·

本研究提出Harmformer方法，结合卷积层与谐波特性，解决传统变换器在旋转等变性方面的不足，提升了处理旋转样本的稳定性与性能。

Harmformer: Combining Harmonic Networks and Transformers for Continuous Rotational Equivariance

BriefGPT - AI 论文速递 ·

本文探讨了一种新型生成模型，用于基于会话的项目推荐，能够有效建模长距离依赖关系。该模型结合了突出卷积层和残差块结构，提升了推荐系统的准确性和训练效率。同时，研究还提出了多种改进推荐性能的方法，包括利用用户交互记录和大型语言模型的集成，显著提高了传统推荐模型的效果。

优化编码器仅Transformer在基于会话的推荐系统中的应用

BriefGPT - AI 论文速递 ·

本文介绍了一系列基于张量分解的深度神经网络压缩方法，涵盖卷积层和全连接层的压缩技术。这些方法在保持模型精度的同时，实现了显著的压缩率，适用于多种神经网络结构，提升了边缘设备的应用性能。

通过分解和最优秩选择实现神经网络压缩的统一框架

BriefGPT - AI 论文速递 ·

文章探讨了深度神经网络的泛化能力与网络深度的关系，指出卷积层等深层结构能提高泛化性能，但深度增加可能导致信息损失。研究表明，深度神经网络具有稳定性，样本复杂度随深度增加而降低。通过实验，提出了泛化误差的边界，并分析了不同损失函数对收敛性的影响，最终得出深度网络的泛化误差随层数增加而显著下降的结论。

深度神经网络的信息论泛化界

BriefGPT - AI 论文速递 ·

本文介绍了一种基于张量分解的卷积层参数压缩方法，在CIFAR-10数据集上实现了80倍的网络压缩和1.1%的精度损失。研究表明，张量分解显著减少了模型大小和能耗，提升了神经网络在边缘设备上的应用效果。

卷积模型的张量网络可压缩性

BriefGPT - AI 论文速递 ·

U-Mamba是一种基于深度序列模型的医学图像分割网络，结合卷积层和序列模型的优点，适应不同数据集并超越现有分割网络。新架构Mamba-UNet和VM-UNet通过引入视觉状态空间块显著提升分割性能。Swin-UMamba和SegMamba在多个数据集上表现优异，适合移动健康应用。Semi-Mamba-UNet采用半监督学习，解决长程依赖问题，推动医学图像分类和分割的进展。

基于大窗口的 Mamba UNet 用于医学影像分割：超越卷积和自注意力

BriefGPT - AI 论文速递 ·

U-Mamba是一种通用的医学图像分割网络，融合了卷积层和序列模型的能力，能够在各种任务中取得优于当前基于CNN和Transformer的分割网络的结果。

U-Mamba: 提高生物医学图像分割的长程依赖性

BriefGPT - AI 论文速递 ·

本研究提出了一种基于变压器特征生成器的多源域适应方法（MSDA-TF），通过捕获浅层空间、时间和频谱 EEG 数据表示的卷积层，以及自注意机制提取这些特征中的全局依赖关系，解决了不同主体之间的变化对传统深度学习算法在自动情感识别中的性能问题。实验证明，MSDA-TF 在 SEED 数据集上取得了有希望的结果。

基于 Transformer 的特征生成的多源领域适应用于基于脑电情感识别的主体独立性

BriefGPT - AI 论文速递 ·

本文介绍了一种基于Siamese的跟踪方法，采用分层特征变换对多级卷积层生成的分层相似度图进行交互式融合，提高了全局的上下文信息，更高效地学习多级特征之间的相互依赖关系，并且在实时速度情况下实现了实际应用。该方法在四个空中基准测试中表现出良好的效果。

IFT: 无幽灵的高动态范围图像融合变压器

BriefGPT - AI 论文速递 ·

深度知识基础学习(一)

Sekyoro的博客小屋 ·

该文介绍了设计轻量化网络模型的策略，包括使用较少的卷积层和全连接层、加入注意力机制、使用残差连接等。同时，给出了一个简单的轻量化网络模型的实现，使用CIFAR-10数据集进行训练和测试，该模型只使用了3个卷积层和1个全连接层，但在CIFAR-10数据集上能够达到70%的准确率。

如何设计一个轻量化网络模型 - Xu_Lin

Xu_Lin ·

池化层是一种先验的下采样方式，步长为2的卷积层的参数是通过学习得到的，采样规则不确定。

数仓如何进行表级控制analyze？

华为云官方博客 ·

YOLO（You Only Look Once）是一种将目标检测视为回归问题的方法，通过将图像划分为网格，预测每个网格内的边界框和类别概率。YOLO具有快速的处理速度，能达到155帧每秒，但定位精度相对较低。其网络设计包括多个卷积层和特定的损失函数，以提高检测准确性。训练过程中使用了ImageNet数据集，并进行了正则化和超参数调整。YOLO的创新在于实时处理和简化架构。

读论文——YOLO v1

gyro永不抽风！ ·