香港大学研究团队提出的新型视觉基础模型OverLoCK,结合了人类视觉的“纵观全局-聚焦细节”机制。在多个数据集上表现优异,特别是在ImageNet-1K上达到84.2%的准确率,超越现有卷积网络和Transformer,展现出强大的动态建模能力。
本研究提出了一种名为长期兴趣时钟(LIC)的方法,以改善流媒体推荐系统中用户兴趣动态建模的不足。该方法通过考虑时间周围的长期行为相关性,更准确地捕捉用户动态兴趣。在在线A/B测试中,用户活跃度提高了0.122%,并已成功应用于抖音音乐App的推荐系统。
本研究针对多尺度生物系统动态建模中的数据挖掘和特征选择问题,提出了一种基于组学的数据建模管道,有效捕捉酵母菌株的动态行为,并为生物过程工程提供不确定性估计框架。
本研究提出了一种基于数据驱动的机器学习技术,用于解决无线传播环境动态建模和预测的挑战。通过学习压缩的高维信道状态信息表示,并结合预测组件,开发了联合嵌入预测架构(JEPA)。在长时间预测任务中,JEPA相较于基准方法具有显著的提升效果。
本文探讨了神经元细胞自动机(NCA)在深度学习中的应用,提出了一种高效的通用扰动方法,显著降低模型性能,可能引发安全问题。研究展示了NCA在动态建模、图案识别及生物模式形成中的潜力,并提出了改进模型AR-NCA,以增强对复杂系统的理解和预测能力。
该论文介绍了新型生成模型SMPLicit,能够联合表示人体姿势、形状和衣物几何形状,支持多种衣物拓扑结构的统一表示。研究提出了多种技术以解决布料操纵问题,并开发了ClothesNet数据集用于服装感知和机器人交互。通过自我监督学习和数据驱动方法,实现了动态服装建模,取得了优于现有技术的结果。
本文介绍了多种面部表情识别(FER)模型的进展,如VSL-CRF、FaceChannel和ViewFX,强调了它们在动态建模、噪声标签压制和多视角识别中的优越性能。这些研究在不同数据集上取得了先进成果,推动了FER技术的发展。
本文提出了一种基于tPARAFAC2的张量分解方法,通过时间正则化提取演变模式,实验结果表明其优于传统方法。同时,介绍了一种结合交替优化的灵活算法框架,适用于多种约束,提升了准确性和效率。此外,研究了动态张量分解和稀疏计数数据建模,提出了多种新算法,并验证了其在实际应用中的有效性。
本研究提出了多种基于反应扩散方程的图神经网络(GNN)模型,如GREAD、ADR-GNN和TDE-GNN,以解决过度平滑和动态建模问题。实验结果显示,这些模型在节点分类和时空数据集上表现优越,具备更强的鲁棒性和计算优势。同时,研究系统回顾了连续动态学在GNN中的应用,并指出了未来的研究方向。
本文介绍了一种名为ViTCA的基于自注意力机制的神经元细胞自动机模型,旨在解决资源限制问题并应用于图像恢复。该模型在保持高重建保真度的同时显著降低了计算资源需求,能够处理更大输入。此外,研究探讨了NCA在动态建模和生物模式形成方面的潜力。
本文提出了一种通过文本提示为素描添加动作并生成可编辑短动画的方法,利用预训练的文本到视频模型进行评分蒸馏,建模小局部变形和全局仿射变换。研究表明,即使是表现不佳的模型也能支持动画表达。通过动态建模模块和视频剪辑训练,现有文本到图像模型能够生成个性化动态图像。此外,AnimeInterp 框架有效解决了动画视频插帧问题,提升了视觉质量和鲁棒性。
本文综述了归一化流在分布学习中的应用,探讨了模型构建、表达能力及计算权衡,涵盖了分段归一化流、随机归一化流及非参数生成模型,提出了多元时序动态建模方法和优化算法,并展示了在实际数据集上的优越性能。
本研究提出了CauESC和MultiESC等多种情感支持对话框架,旨在通过识别情绪原因和动态建模提升情感支持的有效性。实验结果表明,这些模型在共情对话生成和情感理解方面表现优异,并为未来研究提供了丰富的数据集和基准结果。
本文提出了一种名为混合动态变分自编码器(MixDVAE)的潜在变量生成模型,用于建模多个移动源组成的系统的动态。通过在单源数据集上预训练DVAE模型来捕捉源的动态,然后将多个预训练DVAE模型的实例集成到一个多源混合模型中,带有离散观测-源分配潜变量。实验结果表明,该方法在计算机视觉任务和音频处理任务上表现良好,并超过了几种基准方法。
该文章提出了一个新的框架来动态建模健康结果与风险因素之间的关联。使用变系数区域分位数回归方法和K最近邻融合拉索方法捕捉年龄的时变效应。经验结果证明了该方法在捕捉健康结果与风险因素之间复杂的年龄依赖关联方面的有效性。
完成下面两步后,将自动完成登录并继续当前操作。