小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
数据集汇总丨英伟达/OpenAI及多所科研机构开源推理数据集,覆盖数学/全景空间/Wiki问答/科研任务/视觉常识等

大模型的发展凸显了推理数据的重要性,优质推理数据集支持复杂推理任务。HyperAI整理了多领域推理数据集,降低了使用门槛,促进科研与模型训练。

数据集汇总丨英伟达/OpenAI及多所科研机构开源推理数据集,覆盖数学/全景空间/Wiki问答/科研任务/视觉常识等

HyperAI超神经
HyperAI超神经 · 2026-03-27T09:49:53Z
基于层次记忆的预训练:区分长尾知识与常识

本文介绍了一种基于层次记忆的预训练方法,旨在提升小型语言模型的性能。该方法通过访问大型记忆库,有效存储和提取长尾知识,同时保持常识理解。实验结果表明,使用这种记忆增强架构的小模型在性能上可与参数更多的常规模型相媲美,并在资源受限的设备上表现优异。

基于层次记忆的预训练:区分长尾知识与常识

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-09T00:00:00Z

中国古代历法结合阴历和阳历,依据月相和太阳年制定。二十四节气反映季节变化,传统节假日如春节和清明体现了对自然、祖先和生活的理解与期待。

你应该了解的中国古代文化常识(一)

dotNET跨平台
dotNET跨平台 · 2025-12-29T00:04:32Z

本文介绍了大噜公司上市(IPO)后的基本投资逻辑。上市使公司从私人转为公众公司,资金通过证券交易所募集。投资者可通过券商购买股票或选择基金、ETF等替代工具。不同市场存在不同风险和门槛,投资者需根据自身情况选择合适的投资方式。

股票市场常识

xxxx的个人博客
xxxx的个人博客 · 2025-12-28T14:25:32Z
怒喷大模型连狗都不如?揭秘硅谷集体幻觉与物理常识缺失,为何只有新架构才能通往通用人工智能|Yann LeCun World Models AMI LLMs AI Startup

杨乐坤在访谈中批评大语言模型,认为其智能水平不及狗,因缺乏与物理世界的关联。他提出的抽象世界模型(JEPA)强调抽象、分层、预测和最小消耗,以解决AI的局限性。杨乐坤计划创办AMI公司,专注于开源研究,支持自动驾驶和机器人技术。

怒喷大模型连狗都不如?揭秘硅谷集体幻觉与物理常识缺失,为何只有新架构才能通往通用人工智能|Yann LeCun World Models AMI LLMs AI Startup

硕鼠的博客站
硕鼠的博客站 · 2025-12-23T00:56:44Z
中国版英伟达变身“理财大户”?面对75亿巨款去向,所谓的“全网暴怒”暴露了多少金融常识匮乏?看懂保本理财背后的流片周期与资金使用效率|摩尔线程 99% 英伟达 科创板 市场质疑

摩尔线程上市后募集75亿资金,99%用于理财,引发公众愤怒和广泛批评,质疑其重理财轻研发。尽管有分析认为此举合规合理,但市场情绪和舆论压力依然显著。

中国版英伟达变身“理财大户”?面对75亿巨款去向,所谓的“全网暴怒”暴露了多少金融常识匮乏?看懂保本理财背后的流片周期与资金使用效率|摩尔线程 99% 英伟达 科创板 市场质疑

硕鼠的博客站
硕鼠的博客站 · 2025-12-16T00:47:31Z
我们在造神运动中,失去的是理性与常识

达芬奇并非完美,他的成功源于复杂的故事和人们对阴谋论的偏爱。现代社会对偶像的崇拜反映了内心的空虚与不安。我们应承认达芬奇的不完美,以重拾勇气,面对不确定的世界。

我们在造神运动中,失去的是理性与常识

太隐
太隐 · 2025-10-19T12:09:37Z
户晨风与基于common sense的知识

许小年指出,经济学界和政策制定者缺乏常识,强调应尊重市场而非国家干预。他认为“常感”比“常识”更为重要,许多人缺乏基于常感的知识。通过历史案例,他说明政策失误源于短视。尽管户晨风学历不高,但在常感方面具有优势,反映出高智商人群常常缺乏常感。

户晨风与基于common sense的知识

心的道理
心的道理 · 2025-09-27T07:51:28Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

多模态后训练反常识:长思维链SFT和RL的协同困境

机器之心
机器之心 · 2025-08-02T12:44:48Z

Qwen与清华团队的研究表明,在大模型强化学习中,仅使用20%的高熵token即可显著提升训练效果,优于使用全部token。这一发现挑战了传统的二八法则,指出低熵token对推理贡献有限,可能限制模型的探索能力。聚焦关键token使模型在泛化能力上表现出色,训练过程中的熵模式演变也强调了高熵token的重要性。

Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好

量子位
量子位 · 2025-06-06T08:57:50Z
用常识解决软件问题:来自波利亚的启示

软件开发的本质是解决问题。匈牙利数学家乔治·波利亚提出的思维方法对程序员有帮助,通过明确“未知”、“数据”和“条件”来有效调试和解决问题。他还强调实践和模仿,以提升问题解决能力。

用常识解决软件问题:来自波利亚的启示

DEV Community
DEV Community · 2025-05-17T17:56:31Z
GPU相关常识

文章讨论了GPU、NPU和TPU等计算单元的特点及其在AI计算中的应用。GPU专注于并行计算,而NPU和TPU则是为特定算法定制的计算单元。文章还提到算力的限制因素,如GPU算力、显存大小和速率。NvLink和NvSwitch技术提升了GPU间的通信效率,解决了大规模计算的瓶颈。英伟达的GH200架构通过整合CPU和GPU,降低了系统间通信延迟,适用于超大规模模型的训练和推理。

GPU相关常识

elmagnifico
elmagnifico · 2025-05-15T16:00:00Z
DocQA:用于生成语言模型的日语文档问答数据集

JdocQA是一个日本语的VQA数据集,包含四个回答,旨在测试常识,帮助减少LLM的幻觉。研究涉及OCR-VQA等模型和数据集,并通过多种指标进行评估。

DocQA:用于生成语言模型的日语文档问答数据集

DEV Community
DEV Community · 2025-05-10T06:02:18Z

本研究旨在解决网络虚假信息日益严重的问题,通过提出一种新颖的虚假信息检测方法——潜在常识冲突检测(MD-PCC)。该方法利用常识冲突构建文章的常识表达,增强检测的有效性。实验证明,MD-PCC在多个数据集上的表现优于现有的虚假信息检测基线,展现出显著的检测能力提升。

通过潜在常识冲突进行鲁棒虚假信息检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

本研究提出了WinoWhat,一个新的语料库,包含WinoGrande验证集的意译,并评估语言模型在五个常识知识类别上的表现。结果显示,所有模型在WinoWhat上的表现远低于预期,表明对WinoGrande的推理能力评估被高估。

WinoWhat:带有常识分类的 paraphrased WinoGrande 句子的平行语料库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究解决了物理人工智能系统在感知、理解和执行复杂物理行为中的不足。通过定义物理常识和具身推理的关键能力,提出了宇宙推理1模型,能够通过长链推理过程在自然语言中生成适当的决策。研究表明,物理人工智能的监督微调和强化学习显著提高了模型的表现,为物理人工智能的发展奠定了基础。

宇宙推理1:从物理常识到具身推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z
人形机器人发展应该回归“常识”,建立“共识”

人形机器人产业快速发展,受到广泛关注,但技术和市场仍需成熟。尽管部分公司取得进展,整体行业面临技术瓶颈和市场挑战。AGI的最佳载体尚无共识,轮式结构可能更具优势。人形机器人需关注空间智能和决策智能,目前仍在开发和验证阶段,未来应理性看待行业发展。

人形机器人发展应该回归“常识”,建立“共识”

机器之心
机器之心 · 2025-03-04T02:17:39Z

人形机器人产业快速发展,满足家政和养老需求,但技术尚需成熟。尽管市场热情高涨,实际应用场景有限,行业需理性看待技术瓶颈与发展挑战。未来成功依赖于AI能力与应用场景的结合,而非单纯追求成本降低。

人形机器人发展应该回归“常识”,建立“共识”

机器之心
机器之心 · 2025-03-03T05:08:29Z

本研究解决了现有规划任务系统忽视任务描述中丰富语义信息的问题,提出了一种新颖的规划方法,利用大型语言模型(LLMs)的参数化知识作为爬山搜索的启发式指导。研究发现,该方法在家庭环境中的任务成功率比类似系统提高了22个百分点,并生成始终可执行的计划,展示了省略中间语言翻译步骤的潜力。

将大型语言模型作为常识启发式方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-31T00:00:00Z
程序员对金融的误解

作者意外进入金融科技领域,发现金融与软件开发的假设常常相悖。金融专业人士重视截止日期,贷款的定义和利率存在许多误解,贷款可由个人或机构发放,利率也不一定固定。金融领域的灵活性和复杂性超出预期,许多常识在实际操作中并不成立。

程序员对金融的误解

DEV Community
DEV Community · 2025-01-30T21:54:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码