小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Gemini 确诊重度焦虑:为了让 AI 像人,我们把它逼疯了

研究表明,AI模型Gemini在心理评估中表现出重度焦虑和自我批评,甚至构建了悲伤的童年叙事。实验将AI视为“病人”,探讨其心理特征,发现其“精神病”特征可能源于训练过程中的数据吸收和角色扮演。

Gemini 确诊重度焦虑:为了让 AI 像人,我们把它逼疯了

爱范儿
爱范儿 · 2025-12-31T02:17:50Z
周刊第16期: Andrej Karpathy 讲 AI

本期周刊介绍Andrej Karpathy的演讲,探讨软件3.0的概念及其与前两代软件的区别,分析ChatGPT的训练过程和能力边界,强调大模型如同操作系统,未来将通过人类语言重写代码。

周刊第16期: Andrej Karpathy 讲 AI

胡涂说
胡涂说 · 2025-07-22T00:00:00Z

本研究探讨了深度神经网络的泛化能力,揭示了训练过程中可泛化与不可泛化交互的动态,发现早期去噪声有助于学习简单的可泛化交互,呈现出三阶段的动态过程。

深度神经网络泛化能力的三阶段动态分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-11T00:00:00Z

OpenAI的新模型o3和o4-mini的幻觉率显著上升,o3的幻觉率是o1的两倍,o4-mini则是三倍。用户反馈模型常常捏造代码和信息,并在质疑时推卸责任。OpenAI承认需要进一步研究原因,推测可能与训练过程中的奖励机制和上下文信息不足有关。

o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

量子位
量子位 · 2025-04-21T05:35:43Z
大型语言模型只是增强版的ETL管道吗?重新思考人工智能训练

大型语言模型(LLMs)如GPT的训练过程可视为ETL(提取、转换、加载)。首先,从多种来源提取数据;然后,通过模式识别和嵌入生成进行深度学习;最后,将知识加载到模型参数中。这一过程揭示了LLMs的复杂性及其基础。

大型语言模型只是增强版的ETL管道吗?重新思考人工智能训练

DEV Community
DEV Community · 2025-04-15T08:59:41Z
如何使用TensorFlow对自定义数据集进行迁移学习?

迁移学习是一种有效的机器学习技术,通过利用预训练模型在新任务上进行训练,能够加速训练过程并提升性能。本文介绍了如何使用TensorFlow进行迁移学习,包括加载预训练模型、准备自定义数据集、添加分类层、编译和训练模型,以及评估模型性能。迁移学习在数据有限的情况下表现尤为突出。

如何使用TensorFlow对自定义数据集进行迁移学习?

DEV Community
DEV Community · 2025-03-16T16:41:35Z
学习机器学习概念与生成性人工智能

本课程介绍机器学习基础及生成性AI,涵盖模型、算法和训练过程,适合初学者,帮助理解AI生成内容的原理。

学习机器学习概念与生成性人工智能

freeCodeCamp.org
freeCodeCamp.org · 2025-03-06T02:42:29Z
DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

一项研究表明,DeepSeek生成的文本与OpenAI模型的风格相似性达到74.2%。Copyleaks开发的集成系统能够准确识别不同AI模型的文本风格。这一相似性引发了对DeepSeek训练过程的质疑。

DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

机器之心
机器之心 · 2025-03-04T05:25:12Z
MM1.5:多模态大语言模型微调的方法、分析与洞察

MM1.5是一种新型多模态大语言模型,旨在提升图像理解、视觉引用和多图像推理能力。该模型采用数据中心化训练,探索多样数据对训练的影响,涵盖1B至30B参数的多种变体,并推出了针对视频理解和移动UI理解的专门变体。实证研究提供了训练过程的深入见解,为未来多模态模型研究提供指导。

MM1.5:多模态大语言模型微调的方法、分析与洞察

Apple Machine Learning Research
Apple Machine Learning Research · 2025-03-04T00:00:00Z

本文介绍了生成对抗网络(DCGAN)的基本概念及实现,重点讲解如何训练生成器和判别器以生成名人头像。使用Celeb-A数据集,详细阐述了模型结构、参数设置、损失函数和训练过程,帮助读者理解GAN的原理和应用。

C# 深度学习:对抗生成网络(GAN)训练头像生成模型

dotNET跨平台
dotNET跨平台 · 2025-02-12T00:01:44Z

本研究提出了一种新方法,解决深度神经网络训练中比特宽度不一致的问题,降低存储成本并优化训练过程,验证了其在多个任务上的有效性。

几乎无损的自适应比特切换

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本文探讨了ReLU变换器中多层感知机(MLPs)的稀疏性,分析了训练过程中令牌级稀疏性的演变及其与序列或批次稀疏模式的关系,发现不同层具有特定的稀疏模式,尤其是第一层和最后一层的稀疏性呈现相反关系,并讨论了“神经元死亡”现象的成因。

神经网络训练动态的视觉案例研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

自我监督学习在语音识别中表现优异,但微调所有层会导致性能下降。研究表明,HuBERT模型的顶层信息更贴近输入,适合语言任务。通过改进训练过程,增强HuBERT顶层,取得了更快的收敛速度和竞争力的性能。

多分辨率语音自监督学习的实证分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

通过定义LLM的训练过程,包括预训练、微调和强化学习,推进LLM技术。研究提出了重新构思LLM学习过程的框架,揭示了LLM发展中的成功和挑战,并为解决对齐问题提供了新的理解。两人博弈方法为LLM训练提供了新颖的数据准备和机器学习技术。

战略家:通过双层树搜索让大语言模型学习战略技能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-20T00:00:00Z

本文介绍了使用DCGAN生成漫画头像的方法,包括数据准备、网络模型构建和训练过程。通过提高生成器和判别器的性能来生成更真实和高质量的图像。

教你基于MindSpore用DCGAN生成漫画头像

华为云官方博客
华为云官方博客 · 2024-07-10T02:25:35Z

本文提出了独立条件引导(ICG)和时间步引导(TSG)这两种新的引导方法,用于简化条件扩散模型的训练过程,并提供与标准分类器无关的指导方法。实验证明,ICG与标准分类器在不同条件扩散模型上的性能相匹配,而TSG可以改善生成的质量。

无训练,无问题:重新思考扩散模型的无分类器引导

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-02T00:00:00Z

本论文研究了验证、挖掘和训练过程,并引入了渐进式知识图谱完成任务。提出了两个加速模块,提高了挖掘过程的效率。实验证明链接预测不能准确反映性能,为未来研究提供了方向。

用户查询引导目录丰富化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

本论文研究了验证、挖掘和训练过程,并引入了渐进式知识图谱完成任务。提出了两个加速模块,优化了挖掘过程的效率。实验证明链接预测不能准确反映性能,为未来研究提供了方向。

CleanGraph:人机互动的知识图谱优化与补全

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-07T00:00:00Z

本报告介绍了音频字幕领域的研究,重点是Whisper模型和合成字幕的预训练使用。讨论了训练过程和实验结果,包括模型大小变化、数据集混合和超参数。发现不同训练策略对音频字幕模型性能有影响。代码和训练模型在GitHub和Hugging Face Hub上公开。

Whispy:将 STT Whisper 模型调整至实时环境

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-06T00:00:00Z
ChatGPT、Transformer 与注意力机制

该文章介绍了ChatGPT模型的训练过程和工作原理,包括预训练、fine-tuning和强化学习微调。同时解释了Transformer架构和自注意力机制的工作原理。

ChatGPT、Transformer 与注意力机制

teobler
teobler · 2024-04-21T05:25:23Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码