该研究提出了一种结合自组织映射(SOM)与视觉变换器(ViTs)的方法,以解决ViTs在小型数据集上的表现问题。研究表明,这种结合显著提升了无监督和有监督任务的性能,具有重要的实际应用潜力。
机器学习模型通过调整内部参数来提升任务性能,学习过程包括输入数据、生成预测、计算误差和更新参数。误差通过损失函数量化,梯度下降算法用于最小化损失。机器学习有监督、无监督和强化学习等不同类型。基础模型通过大规模数据训练,具备广泛适应性,简化复杂系统的部署。理解这些概念对软件工程师至关重要。
本研究概述了表格数据的深度学习架构,提出了两种基准架构,并发现Transformer在性能上最优。与传统机器学习方法比较,结果显示传统方法在有监督学习中仍优于深度学习。此外,研究提出了Tabular Foundation Models (TabFMs),利用预训练的大型语言模型提升对表格数据的理解,并探讨了其局限性和未来发展方向。
本研究提出了一种基于粗糙标注的细粒度类别发现方法,结合自对比学习和有监督学习,以降低标记成本并提高聚类准确性。通过动态概念对比学习和自平衡协助对比框架,增强了细粒度类别的发现能力。此外,研究还提出了主动广义类别发现和正则化参数InfoMax方法,显著提升了未知类别的识别性能。实验结果验证了这些方法的有效性。
本文探讨了通过内部记忆方法学习高维连续系统的策略,结合有监督学习和轨迹优化,解决物理控制问题。研究利用RNN和贝叶斯推断,提出了动态规划和主动推断的框架,强调在复杂环境中有效规划行动的重要性,并探索分层模型中的混合表示。
本文探讨了再生核希尔伯特空间理论在有监督学习和回归中的应用,提出了新的算法和模型,解决了非线性函数数据分析和偏微分方程的学习问题。研究展示了神经算子的有效性,强调了数据驱动方法在科学问题中的潜力,并提出了无监督预训练和上下文学习方法以提高数据效率和泛化性能。
该文章介绍了多种基于统计和深度学习的文本分割方法,适用于不同语言和领域。研究涵盖无监督和有监督学习,提出了利用视觉知识和无标点文本进行句子分割的新技术,显著提高了分割的准确性和效率。
本文研究了深度学习与传统机器学习在表格数据上的性能,发现传统方法在有监督学习任务中表现更优。通过对多个数据集的评估,提出了优化模型性能的策略,并探讨了特征选择和合成数据生成的挑战与机遇。
本文介绍了一种名为Aligner的新方法,通过有监督学习对大型语言模型进行高效对齐,提升模型的有用性和无害性。Aligner在多个模型上实现了显著性能提升,并通过InferAligner降低有害输入的攻击成功率。此外,研究探讨了隐私保护对齐和辩证对齐模型,以增强系统安全性。
本文介绍了一种新的大型语言模型对齐方法——Aligner,通过有监督学习显著提升模型性能。在11种不同模型上,Aligner平均提高了18%的有用性和23%的无害性,特别是在Llama2-70B模型上表现尤为突出。此外,研究还探讨了其他对齐策略和模型训练方法,强调了对齐在确保语言模型安全性和实用性方面的重要性。
本研究提出了一种简单且可解释的目标函数来计算场景流,适用于有监督学习、自监督学习和运行时优化,优于先前相关工作,适用于动态环境下的运动分割和点云密集化等应用。
该研究使用图神经网络的有监督学习方法解决社区检测问题,比信念传播算法表现更好。同时,对线性GNN进行社区检测问题训练的优化梯度进行了分析。
本文提出了一种处理回归算法中连续敏感属性的公平经验风险最小化方法,并泛化到整个有监督学习情境。同时,构建了一种针对内核方法的共性公平估计方法,实现了精度和公平要求的有效平衡。
该研究使用有监督学习方法,识别出特定领域的模型特征子集,并解释保留特征的语义。研究发现人类如何根据性别包容性和国际性来区分运动类别,以及不同领域中特征对不同语义维度的预测能力。该研究讨论了人工智能系统与人类知识之间的对齐意义。
本文研究了以余弦基函数为基础的无记忆单变量连续函数逼近方法,通过有监督学习获得逼近系数。该方法简单且具有可控的收敛时间和误差调整,通过仿真实例展示了其性能。
本文介绍了如何将风控场景中的数据建模为图结构,并使用图计算进行风险识别。通过将不同的信息作为节点和边,可以形成一个覆盖范围广泛的异构图,并使用不同的图模型进行有监督或无监督学习。
完成下面两步后,将自动完成登录并继续当前操作。