标签

 建模 

相关的文章:

本列表页提供了关于建模技术的研究综述,包括密码建模、表格数据建模、轮胎力建模、声场建模以及视图重建等内容。通过这些文章,您可以了解到最新的建模技术和应用。

主题建模的迭代方法

原文约300字,阅读约需1分钟。发表于:

使用 BERTopic 包进行迭代过程的主题建模,通过聚类比较选定的三种评估标准,展示了无法进一步改进的一组主题。该方法在 COVIDSenti-A 数据集的子集上进行演示,并显示了早期成功,表明将其与其他主题建模算法结合使用的进一步研究可能是可行的。

本研究使用BERT模型、UMAP降维和K-Means聚类算法从未分类的文本集合中获取主题。通过TF-IDF统计、主题多样性和主题连贯性评估主题的含义。结果显示主题建模是对无标签文本进行分类或聚类的可行选择。

相关推荐 去reddit讨论

通过世界动态建模提升智能体学习能力

原文约200字,阅读约需1分钟。发表于:

通过自动化动态学习框架 DiVE 指导的大型语言模型在 Crafter 环境中能够做出决策,实现与人类玩家相当的奖励。

本文介绍了一种通过fine-tuning使用世界模型的方法,以提高大型自然语言模型在推理和规划中的性能。实验证明该方法在18项下游任务上能够显著提升LM的表现,尤其是在1.3B和6B的小型LM上。

相关推荐 去reddit讨论

EllipBench:基于机器学习的椭圆度建模的大规模基准测试

原文约600字,阅读约需2分钟。发表于:

应用椭偏光谱测量薄膜的光学特性和厚度,在反问题求解时传统的机器学习方法需要耗费大量时间和人工技术,为此,本研究提出了一种深度学习框架,结合残差连接和自注意机制,使用大规模基准数据集进行训练,在薄膜厚度预测方面取得了最先进的性能。

MatSci ML是一个用于建模固态材料的新型机器学习基准,使用多样化的材料系统和属性数据进行模型训练和评估,促进了算法和方法的发展。它允许研究人员结合多个数据集的观测结果进行共同属性预测。评估了不同的图神经网络和等变点云网络在几个基准任务上的性能。

相关推荐 去reddit讨论

使用视觉与语言模型建模人类概念处理中的多模态集成

原文约300字,阅读约需1分钟。发表于:

当前的视觉和语言深度神经网络模型(VLMs)整合多模态信息,其表示与大脑活动高度相关,比起纯语言和纯视觉深度神经网络模型(DNNs)具有更好的大脑一致性,同时与行为一致性无明显关系。

连接文本和视觉模态在生成智能中起关键作用,最近的研究关注多模态大型语言模型 (MLLMs),分析了它们的体系结构、对齐策略和训练技术,并对其在多个任务上的应用进行了详细分析。调查比较了现有模型的性能和计算要求,为未来的 MLLMs 提供了基础。

相关推荐 去reddit讨论

机器学习和凸约束在浅水方程子网通量建模中的应用

原文约300字,阅读约需1分钟。发表于:

我们提出了一种结合机器学习和通量限制的子网格尺度建模方法,用于一维浅水方程的通量限制有限体积方法中。通过使用神经网络将保守目标方案的数值通量拟合到单调细网格离散化的粗网格平均值上,对子网格尺度组分进行参数化。为了确保正性保持和局部极大原理的有效性,我们使用了一个通量限制器,将等效波动形式的中间状态限制在一个凸允许集中。我们的数值研究结果证实,即使对于网络未经训练的情况,机器学习与整体凸限制的...

本文介绍了一种结合机器学习和通量限制的子网格尺度建模方法,用于一维浅水方程的通量限制有限体积方法中。通过使用神经网络将保守目标方案的数值通量拟合到单调细网格离散化的粗网格平均值上,对子网格尺度组分进行参数化。数值研究结果证实,机器学习与整体凸限制的结合能产生有意义的封闭结果。

相关推荐 去reddit讨论

PrevPredMap:利用先前预测进行在线矢量化高清地图构建的时间建模研究

原文约300字,阅读约需1分钟。发表于:

PrevPredMap 是一种先进的时间建模框架,通过利用先前的预测来构建在线矢量化高清地图,经过大量实验在 nuScenes 和 Argoverse2 数据集上取得了最先进的性能。

本文重新审视了视频预测中的分层模型,通过先估计语义结构序列,再通过视频到视频的转换将结构转化为像素。通过在汽车驾驶和人类舞蹈等三个数据集上的评估,证明了该方法能够在非常长的时间范围内生成复杂的场景结构和运动,并且取得了比现有方法长几数量级的预测时间。

相关推荐 去reddit讨论

强过「黄金标准」,快3,500倍,成本低10万倍,物理建模融合AI,谷歌天气模型登Nature

原文约3800字,阅读约需9分钟。发表于:

谷歌研究开发了一种名为NeuralGCM的新方法,将传统的基于物理模型的建模与机器学习相结合,准确模拟地球大气层。NeuralGCM能够生成2-15天的天气预报,超过现有模型的准确性。该模型更快、更具成本效益,并在预测方面达到了与机器学习模型和欧洲中期天气预报中心相似的准确性。NeuralGCM的架构结合了可微分的动力核心和使用神经网络预测未解决过程的学习物理模块。该模型使用ECMWF天气数据进行性能评估,在天气和气候预测方面优于现有模型。NeuralGCM是开源的,有潜力革新气候建模。

强过「黄金标准」,快3,500倍,成本低10万倍,物理建模融合AI,谷歌天气模型登Nature
相关推荐 去reddit讨论

TWIN V2: 快手增强点击率预测的大规模超长用户行为序列建模

原文约400字,阅读约需1分钟。发表于:

对大规模推荐系统中长期用户兴趣建模的意义正在逐渐引起研究人员和从业者的关注。在这篇论文中,我们介绍了 TWIN-V2,它是 TWIN 的改进版,通过分而治之的方法来压缩用户行为序列并揭示更准确和多样化的用户兴趣。通过在离线阶段对具有相似行为特征的项目进行分层聚类,我们可以将行为序列压缩到可在在线 GSU...

TWIN-V2是TWIN的改进版,通过分而治之的方法压缩用户行为序列,揭示准确和多样化的用户兴趣。它使用分层聚类将行为序列压缩到适合在线检索的长度。TWIN-V2在一个亿级别的工业数据集上进行了实验和测试,并成功部署在快手的主要流量上。

相关推荐 去reddit讨论
相关推荐 去reddit讨论

增强时态行动定位:带有循环机制的先进 S6 建模

原文约400字,阅读约需1分钟。发表于:

以选择性状态空间模型为基础,通过特征聚合 Bi-S6 块、双向 Bi-S6 结构和循环机制,提出了一种新的时间行动定位(TAL)架构,用于增强时间和通道依赖建模,在不增加参数复杂性的情况下能够捕捉长距离依赖和时间因果关系,通过在基准数据集上进行广泛实验验证了所提出方法的优越性,达到了...

该文章提出了一种新的时间行动定位(TAL)架构,通过特征聚合和循环机制,能够捕捉长距离依赖和时间因果关系。实验证明该方法在多个基准数据集上取得了优越结果,为未来的研究奠定了基础。

相关推荐 去reddit讨论