小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大型语言模型嵌入能否改善时间序列预测?一种实用的特征工程方法

本文探讨了大型语言模型(LLM)嵌入对时间序列预测的影响。通过比较基线模型与包含LLM嵌入的模型,结果显示两者的准确率相近,LLM嵌入的效果并不显著。在高频复杂数据环境中,传统方法仍然更为有效。

大型语言模型嵌入能否改善时间序列预测?一种实用的特征工程方法

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-27T14:40:25Z
应对(几乎)任何数据科学项目的五步指南

数据科学项目成功的五个关键步骤包括:明确问题、深入理解数据、建立基线模型、系统改进和实际验证。首先,清晰定义业务目标;其次,探索数据质量和特征关系;然后,构建简单的基线模型;接着,迭代特征而非模型;最后,确保验证与生产环境一致。这些步骤是确保项目成功的基础。

应对(几乎)任何数据科学项目的五步指南

KDnuggets
KDnuggets · 2025-11-18T15:30:28Z
人工智能行车记录仪数据集在真实条件下以87%的准确率预测汽车碰撞

该研究推出了一个新的行车记录仪视频数据集,包含5000个视频片段,用于汽车碰撞预测。其中3000个为无碰撞示例,2000个为有碰撞示例,涵盖多种车辆、天气和路况。基线模型在真实条件下的准确率为87%。

人工智能行车记录仪数据集在真实条件下以87%的准确率预测汽车碰撞

DEV Community
DEV Community · 2025-03-08T07:04:45Z

本研究提出了一种简单的基线模型LMMRotate,旨在解决多模态语言模型在航空检测任务中的不足。该基线通过文本输出和公平评估,检测性能与传统模型相当,为未来研究提供了参考。

A Simple Baseline for Multimodal Language Models in Aviation Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z

本研究推出OpenNER 1.0,这是一个标准化的开放获取命名实体识别数据集,涵盖51种语言的34个数据集,旨在推动多语言NER研究并提供基线模型。

OpenNER 1.0:标准化的50多种语言开放获取命名实体识别数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种新方法,通过光场几何约束实现高效分割,显著提升实时处理速度,分割效果超越现有基线模型。

通过约束提示实现光场中任意对象的实时分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本研究提出了一种解缠自监督学习(DisentangledSSL)方法,有效解决了多模态表示学习中的信息解缠问题,优于基线模型,具有实用价值。

Controlled Disentangled Information Standards for Multimodal Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文介绍了多模态问答挑战ManyModalQA,要求代理同时考虑文本、图像和表格三种模态。通过维基百科数据和众包问题-答案对,构建了模态选择器网络,分析问题中的指示模态词。尽管基线模型的表现与人类存在差距,但期望能推动多模态QA模型的研究与迁移学习。

CT2C-QA:针对中文文本、表格和图表的多模态问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本研究探讨了机器学习在临床应用中的挑战,包括透明度不足和评估指标复杂。研究表明,引入更强的基线模型可以有效提升医疗机器学习的评估,帮助实践者应对这些问题,并提供最佳实践以促进模型的有效部署。

Stronger Baseline Models -- A Key Requirement for Aligning Machine Learning Research with Clinical Utility

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

匈牙利语资源有限,研究人员开发了HunSum-2,一个用于训练摘要模型的开源匈牙利语语料库。数据集经过清洗、预处理和去重,包括抽象和提取式摘要。研究人员使用该数据集训练了基线模型,并进行了评估。数据集、模型和代码都是公开可用的。

从新闻到摘要:构建一个用于抽取和概括式摘要的匈牙利语语料库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-04T00:00:00Z

本研究通过增强语料库,对语音到文本翻译进行了端到端研究,实验结果表明可以训练出高效的语音转换模型。提供语料库,希望未来研究能挑战基线模型。

AIx 速度:利用语音识别模型的听力理解进行播放速度优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

评估了ChatGPT和OpenAssistant两种LLM的零次效果,发现无法与经过微调的基线模型匹配。提示策略影响分类准确性,差异超过10%。

大型语言模型作为 MOOC 课程的评分器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-06T00:00:00Z

该研究对18种基线模型进行了评估,比较了它们在多个方面的表现。结果显示没有明确的最佳方法,最好的方法取决于用户的目标。

深度神经网络选择性分类基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-23T00:00:00Z

本研究提出了一种通用的多尺度框架,可改进基于Transformer的时间序列预测模型的性能。研究结果表明,该方法可将性能提高到38.5%,且优于基线模型。

长期时间序列预测中的有效模型规模再思考

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-22T00:00:00Z

xDial-Eval是一种基于英文对话评估数据集的多语言对话评估基准测试,建立了自监督和多语言基线模型。最好的基线模型在所有数据集和语言上的平均Pearson相关系数分别提升了6.5%和4.6%。

NormDial: 用于建模社会规范遵守与违规的可比较双语合成对话数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码