本研究探讨了神经网络架构是否应根据问题的结构和对称性进行设计。结果显示,等变模型在数据效率上优于非等变模型,且经过充分训练后,非等变模型可通过数据增强缩小差距。等变模型在每个计算预算下表现更佳,最佳预算分配存在差异。
本研究探讨了等变模型在分子性质预测和动态仿真中的应用,发现去除未使用的球面谐波阶数可以提升模型性能,改善潜在空间结构。
本文研究了潜在表示中等变模型对归纳偏好的影响,并通过两个例子展示了这些原则的作用。作者还证明了等变神经网络中记录的现象在标准神经网络中也存在。
该文介绍了一个新的数据集xxMD,包含了真实的化学反应核配置空间和能量力学信息。作者发现等变模型在该数据集上的表现较差,强调了构建具有外推能力的可推广NFF模型所面临的挑战。
该文提出了一个使用李群和李代数的框架,用于处理几何变换的不规则群,重点关注李群 GL+(n, R) 和 SL (n, R)。作者展示了如何参数化卷积核来构建关于仿射变换等变的模型,并在标准的仿射不变基准分类任务上评估了模型的鲁棒性和越域泛化能力,结果表明该模型优于所有先前的等变模型以及所有胶囊网络提议。
完成下面两步后,将自动完成登录并继续当前操作。