小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
《GPT 图解》笔记:微调与RLHF、总结

本文讨论了微调和人类反馈强化学习(RLHF)在GPT模型训练中的应用。微调通过特定对话数据优化模型,RLHF则通过监督学习和人类偏好评分提升回答质量。作者分享了学习过程中的体会,强调AI辅助学习的高效性,并回顾了从N-Gram到GPT的技术演变。

《GPT 图解》笔记:微调与RLHF、总结

Ying’s Blog
Ying’s Blog · 2026-06-14T06:08:17Z
人工智能与机器学习:理解差异及其实际应用

人工智能(AI)是模拟人类智能的广泛领域,机器学习(ML)是其子集,通过数据学习模式。AI系统分为反应机器和有限记忆系统,机器学习方法包括监督学习、无监督学习和强化学习。深度学习利用多层神经网络自动提取特征,适用于复杂任务如图像和语言处理。AI与机器学习的结合推动了现代技术的发展,如推荐系统和欺诈检测。

人工智能与机器学习:理解差异及其实际应用

Databricks
Databricks · 2026-03-17T12:14:40Z
监督学习:预测建模的基础

监督学习是机器学习中用于预测建模的基础,通过标记数据训练模型,以便对新数据进行准确预测。该过程包括训练数据、学习算法和训练模型,主要分为回归和分类任务。成功的监督学习依赖于高质量的数据和模型的泛化能力。

监督学习:预测建模的基础

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-07T11:00:15Z
10个必备的机器学习关键术语解析

本文介绍了机器学习的十个关键术语,包括监督学习、无监督学习、强化学习、过拟合与欠拟合、偏差-方差权衡、损失函数、梯度下降、交叉验证、特征工程和模型评估指标。这些概念对于理解机器学习技术及其应用至关重要。

10个必备的机器学习关键术语解析

MachineLearningMastery.com
MachineLearningMastery.com · 2025-06-25T12:00:31Z

清华大学与英伟达、斯坦福联合提出NFT(隐式负向策略),通过负向数据训练正向模型,缩小监督学习与强化学习的差距。NFT在大模型中表现优异,显著提升数学能力,且不依赖外部数据。

监督学习也能从错误中学习反思?!清华英伟达联合提出隐式负向策略爆炸提升数学能力

量子位
量子位 · 2025-06-22T06:06:31Z
机器学习算法的类型

机器学习算法通过分析数据发现模式,主要分为四类:1. 监督学习,使用标记数据进行分类和预测;2. 无监督学习,处理未标记数据以识别结构;3. 半监督学习,结合少量标记和大量未标记数据;4. 强化学习,通过试错训练代理以优化决策。

机器学习算法的类型

DEV Community
DEV Community · 2025-05-22T21:28:34Z

本研究提出了一种新框架,解决机器人在与人类互动时缺乏视觉视角转换能力的问题,并引入合成数据集以支持空间推理任务的监督学习。

Embodied Cognition of Robots through Spatially-Based Synthetic Worlds

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z
机器学习教程:你的人工智能概念入门指南

机器学习是人工智能的一个子集,使计算机能够从数据中学习并提升性能。主要概念包括监督学习、无监督学习、训练与测试、特征与标签、过拟合与欠拟合。常用算法有线性回归、逻辑回归和决策树。初学者可使用Python及其库(如Scikit-learn、Pandas)进行实验,项目步骤包括定义问题、收集数据和选择模型。

机器学习教程:你的人工智能概念入门指南

DEV Community
DEV Community · 2025-05-17T05:47:56Z

本研究提出了GC MVSNet++模型,解决了传统多视角立体视觉方法在几何一致性检查中的不足。实验结果表明,该方法加快了学习过程,并在多个数据集上取得了最佳性能,展示了监督学习在多视角和多尺度几何一致性中的潜力。

Combining 3D Geometry and Machine Learning for Multi-View Stereo Vision

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本研究探讨了肺炎诊断中的不确定性,提出使用卷积神经网络(CNN)进行监督学习。通过MobileNetV2和ResNet101V2架构,提升了肺炎检测的有效性和稳定性,结果显示MobileNetV2在训练稳定性和过拟合控制方面表现优越。

Diagnostic Uncertainty in Pneumonia Detection Using CNN MobileNetV2 and CNN from Scratch

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z
什么是机器学习,它是如何工作的?

机器学习是人工智能的核心,旨在让计算机从数据中学习和自我改进。主要分为三种类型:监督学习、非监督学习和强化学习。它在Netflix推荐、垃圾邮件过滤、自驾车、医疗创新和语音助手等日常应用中发挥着重要作用,正在改变各个行业。

什么是机器学习,它是如何工作的?

DEV Community
DEV Community · 2025-04-18T21:05:24Z
什么是监督学习?

监督学习是一种利用带标签数据训练算法的机器学习方法,主要分为分类和回归。常用算法包括线性回归和决策树。模型的准确性依赖于训练数据的质量和数量,广泛应用于欺诈检测和情感分析等领域。

什么是监督学习?

DEV Community
DEV Community · 2025-04-15T01:39:02Z

本研究提出了PROPEL框架,结合监督学习与深度强化学习,旨在优化大规模供应链规划。该方法显著缩小搜索空间,提高解决方案质量,尤其在处理数百万变量时,原始积分减少60%,原始间隙缩减88%。

PROPEL: Supervised and Reinforcement Learning for Large-Scale Supply Chain Planning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-10T00:00:00Z

本研究提出了一种基于公式的监督学习框架(FDSL),旨在解决环境声音分析模型预训练中高质量标记数据不足的问题。通过使用合成数据集Formula-SED进行预训练,显著提升了模型的准确性和训练速度。

公式监督声音事件检测:无真实数据的预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z
图像识别中的监督学习:工作原理

人工智能在各行业中,尤其是图像识别领域,发挥着重要作用。监督学习通过分析标记数据训练模型,识别图像模式。印度浦那市成为AI研究中心,提供多种培训课程,培养AI人才。监督学习在医疗、安防和零售等行业的应用不断发展,未来将更加高效智能。

图像识别中的监督学习:工作原理

DEV Community
DEV Community · 2025-03-22T07:49:14Z
机器学习在数据科学中的作用:特里凡德伦数据科学课程的期望

机器学习是数据科学的核心,能够帮助企业自动化任务、识别模式和做出决策。特里凡德伦的数据科学课程涵盖监督学习、无监督学习和深度学习,注重实践项目和行业应用。掌握机器学习将提升就业竞争力,带来多种职业机会。

机器学习在数据科学中的作用:特里凡德伦数据科学课程的期望

DEV Community
DEV Community · 2025-03-21T04:15:34Z
终极机器学习备忘单:2025年关键概念与快速参考

机器学习(ML)快速发展,数据科学家和工程师需掌握监督学习、无监督学习和强化学习等关键概念及算法。了解模型性能对准确部署ML模型至关重要。未来,自动化机器学习和可解释AI将推动ML进步,此备忘单是优化ML工作流程的重要资源。

终极机器学习备忘单:2025年关键概念与快速参考

DEV Community
DEV Community · 2025-03-11T08:48:49Z
什么是机器学习?初学者指南

机器学习(ML)是人工智能的一个子集,使计算机能够从数据中学习并做出决策。主要类型包括监督学习、无监督学习和强化学习,广泛应用于医疗、金融和自动驾驶等领域。ML工作流程包括定义问题、数据收集与处理、模型选择、模型训练与评估。Python是最流行的ML编程语言,常用库有NumPy、Pandas和Scikit-learn。

什么是机器学习?初学者指南

DEV Community
DEV Community · 2025-03-02T00:58:35Z
人工智能突破:新方法使模型更好地理解长文档,像人类一样

该研究提出了一种监督链式推理方法,以提升AI模型对长文档的理解能力。通过专门的训练数据和逻辑推理链,测试结果显示其在长文档理解任务中的表现更佳。

人工智能突破:新方法使模型更好地理解长文档,像人类一样

DEV Community
DEV Community · 2025-02-20T07:17:21Z

本研究提出了AdaGraph-T3框架,解决了图异常检测中标记异常稀缺的问题。该框架结合监督与自监督学习,显著提升了跨领域图异常检测的性能,实验结果表明其在多个设置中优于最佳竞争模型。

Graph Anomaly Detection across Out-of-Distribution Domains: Adaptive Test-time Representation Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码