小红花·文摘

GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2，且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介)

结构之法算法之道 ·

本研究提出了SEAL框架，旨在解决增量学习中新任务学习与旧知识保留的平衡问题。通过动态调整模型结构和交叉蒸馏训练，SEAL在减少遗忘和提高准确性的同时，显著降低了模型大小，展现了其高效性和适应性。

SEAL: Searchable Expandable Architecture for Incremental Learning

BriefGPT - AI 论文速递 ·

本研究填补了自解释神经网络综述的空白，强调其在模型结构中揭示预测原理的能力。通过五个关键视角总结现有研究，提供可视化案例，并识别领域挑战与未来研究方向。

A Comprehensive Survey of Self-Explaining Neural Networks

BriefGPT - AI 论文速递 ·

本研究提出了一种利用预训练回归器的框架，解决了3D对象编辑中对车辆模型细致控制的不足。该方法支持多属性编辑，保持模型结构完整性，实验结果表明在车辆三维模型编辑中效果显著。

Manipulating Vehicle 3D Shapes through Latent Space Editing

BriefGPT - AI 论文速递 ·

本研究探讨了法语命名实体识别（NER）的外部因素，如模型结构、语料标注和数据增强，以提升NER性能。实验结果显示，模型F1分数从62.41提升至79.39，表明综合考虑外部因素能显著改善NER效果。

Comparative Analysis of Extrinsic Factors for Named Entity Recognition in French

BriefGPT - AI 论文速递 ·

本文介绍了多个深度学习框架在动态图形学中的应用，包括TGN、TGL、GraphMixer等。这些框架通过改进训练算法和模型结构，提高了训练速度和准确性，解决了时间依赖性问题，并在节点和图分类任务中展示了有效性。

开源版 Sora：AI 视频生成的高性能实现 | 开源日报 No.291

开源服务指南 ·

本研究提出了多种新型变化检测方法，包括TransY-Net、Siamese网络和轻量级结构感知Transformer（LSAT），通过改进特征提取和模型结构，提升了遥感图像变化检测的性能。这些方法在多个基准数据集上取得了最先进的结果，展示了特征学习和计算效率的优势。

卷积神经网络 - Transformer 融合网络与变化检测的关联

BriefGPT - AI 论文速递 ·

本研究探讨了神经网络的可解释性，提出通过分解多义神经元和应用稀疏特征电路的方法。研究表明，多义性影响模型性能，并强调模型结构对可解释性的影响。实验结果显示，神经元能够有效表示人类可理解的特征，提升了神经网络的透明度和可操控性。

TextBrewer是一个基于PyTorch的知识蒸馏工具包，支持多种模型结构和NLP任务。它提供了方便快捷的蒸馏框架，无需修改模型结构。用户只需准备好教师模型、学生模型、训练数据和配置，即可开始蒸馏。TextBrewer在多个典型NLP任务上取得了较好的压缩效果。安装要求Python和PyTorch版本。蒸馏流程包括准备和蒸馏两个阶段。TextBrewer提供了示例和实验结果，用户可以根据需求选择配置和函数进行蒸馏。