小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
MOSS-TTS:基于 CAT 架构的解耦式生产级语音生成模型;打破单细胞分析壁垒:Pan-Cancer scRNA-Seq 数据集构建跨癌种免疫图谱基准

MOSS-TTS系列是MOSI.AI与OpenMOSS联合推出的多模型语音生成工具,克服了单一模型在复杂场景中的局限,支持高保真语音、对话和实时交互,适用于多种语言和风格切换。

MOSS-TTS:基于 CAT 架构的解耦式生产级语音生成模型;打破单细胞分析壁垒:Pan-Cancer scRNA-Seq 数据集构建跨癌种免疫图谱基准

HyperAI超神经
HyperAI超神经 · 2026-03-06T06:01:17Z

来自美国能源部橡树岭国家实验室的科学家们提出了一种面向基础模型的分布式跨通道分层聚合方法(D-CHAG),该方法对 token 化过程进行分布式处理,并采用分层策略进行通道聚合,从而使极大规模模型能够在多通道数据集上运行。

内存占用最高降低75%,美国能源部科学家提出跨通道分层聚合方法D-CHAG,实现极大规模模型多通道数据集运行

HyperAI超神经
HyperAI超神经 · 2026-02-11T08:16:45Z

这是一个由北京通用人工智能研究院 BIGAI 于 2025 年发布的一个面向具身智能(Embodied AI)研究的开源模拟环境与资产数据集,包含了超过 25,877 个不同的操作任务场景和 100 个高质量三维模拟场景,覆盖多房间室内环境与完整的室外城市场景,所有场景均可在 60 FPS 以上稳定运行,同时提供 3,000 余个可交互三维物体,涵盖 500 余类物品类别,并包含 10...

数据集汇总丨16个具身智能数据集,覆盖抓握/问答/逻辑推理/轨迹推理等领域

HyperAI超神经
HyperAI超神经 · 2026-02-05T03:30:12Z
在Python中处理十亿行数据集(使用Vaex)

Vaex是一个高性能的Python库,专为处理超大数据集而设计。它通过外存处理和延迟计算,避免将整个数据集加载到内存中,实现快速分析,特别适合处理超过1GB的大数据。

在Python中处理十亿行数据集(使用Vaex)

KDnuggets
KDnuggets · 2026-02-02T17:00:24Z

DiagAgent 是由上海交通大学和上海人工智能实验室的 AI4Med 团队发布的诊断智能体(7B、8B、14B),能够主动管理诊断轨迹,选择最具信息量的检查、决定何时停止检查并给出准确的最终诊断。仅需约 13 GB 显存即可在消费级 GPU 上高效运行,并支持 FP8/NVFP4 量化,速度进一步提升最高 2.7 倍,将 AI...

FLUX.2‑klein‑4B:步数蒸馏实现 4 步亚秒级图像生成,在消费级 GPU 上体验实时交互;Vehicles OpenImages 数据集:专注车辆检测与定位

HyperAI超神经
HyperAI超神经 · 2026-02-02T08:33:47Z

Nemotron Speech Streaming ASR 是由英伟达(NVIDIA)Nemotron Speech 团队发布的流式自动语音识别模型,该模型专为低延迟实时语音转写场景设计,同时具备高吞吐的批量推理能力,适用于语音助手、实时字幕、会议转录及对话式人工智能等应用。模型参数规模仅 70 亿(7B),但在真实网页操作任务中表现突出,在多项 Web Agent...

TRELLIS.2:采用 O-Voxel 技术,高效生成复杂 3D 几何与材质;Patient Churn Prediction 数据集:帮助识别有流失风险的患者

HyperAI超神经
HyperAI超神经 · 2026-01-26T07:49:18Z

本文系统整理了一批具身智能相关的高质量数据集、在线教程、论文,为进一步学习和研究提供参考,欢迎前往 hyper.ai 探索更多优质资源!

具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文

HyperAI超神经
HyperAI超神经 · 2026-01-23T06:09:46Z

其研究背景源于灵巧抓取在杂乱场景下的高成功率需求,特别是在未见过的物体、光照及背景组合下实现超过 90% 的成功率,此框架采用预训练的视觉-语言模型作为高层任务规划器,并学习基于扩散的策略作为低层行动控制器,其创新之处在于利用基础模型实现强大的泛化能力,并使用基于扩散的模仿学习获取灵巧行动。Fast-ThinkAct 通过从教师模型中蒸馏潜在...

具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文……

HyperAI超神经
HyperAI超神经 · 2026-01-23T04:03:34Z
我们在同一数据集上调优了四种分类器:没有一个真正改善

对葡萄牙学生表现数据进行四种分类器的超参数调优实验表明,调优未显著提升模型性能,反而略有下降。这表明默认设置在许多情况下已足够有效,强调了在机器学习中了解何时停止调优的重要性。

我们在同一数据集上调优了四种分类器:没有一个真正改善

KDnuggets
KDnuggets · 2026-01-20T15:00:39Z

九坤投资旗下至知创新研究院开源发布IQuest-Coder-V1代码大模型,该模型基于"代码流"思想,通过分析真实代码变更历史提升生成质量,支持128K长上下文处理。同时,HyperAI官网更新了包括vLLM部署教程、QwenLong-L1.5长文本模型及Qwen-Image-2512图像生成模型等资源,并收录AI百科词条和学术会议信息,为开发者提供一站式AI资源平台。

IQuest-Coder-V1:基于代码流训练的编程逻辑增强模型;Human Face Emotions:基于多标注维度的人脸情绪识别数据集

HyperAI超神经
HyperAI超神经 · 2026-01-19T09:10:46Z
Hugging Face发布FineTranslations,一个万亿标记的多语言平行文本数据集

Hugging Face发布了FineTranslations数据集,包含超过1万亿个平行文本标记,涵盖英语及500多种语言,旨在改善机器翻译,尤其是英语到低资源语言的翻译。数据集来源于FineWeb2,经过严格筛选和处理,确保质量,可通过Hugging Face访问,支持大规模处理。

Hugging Face发布FineTranslations,一个万亿标记的多语言平行文本数据集

InfoQ
InfoQ · 2026-01-18T08:00:00Z
生产环境中大数据集的分页:为何OFFSET失效而游标更胜一筹

MVP与生产就绪应用的区别在于细节和最后20%的工作。文章探讨了在大数据集上进行分页的问题,指出缺少索引和偏移分页会导致性能下降。通过采用基于游标的分页方式并添加索引,可以显著提升查询速度和用户体验。Sentry工具用于监测数据库查询性能,确保系统在实际使用中的表现良好。

生产环境中大数据集的分页:为何OFFSET失效而游标更胜一筹

Sentry Blog
Sentry Blog · 2026-01-15T00:00:00Z
NVIDIA发布开放模型、数据集和工具,涵盖人工智能、机器人和自动驾驶领域

NVIDIA发布了一系列开放模型、数据集和开发工具,涵盖语言、机器人和自动驾驶等领域。新模型包括Nemotron系列的语音识别和安全组件,以及支持感知和推理的Cosmos基础模型,还有专注于推理的Alpamayo自动驾驶模型。所有资源可通过GitHub和Hugging Face获取。

NVIDIA发布开放模型、数据集和工具,涵盖人工智能、机器人和自动驾驶领域

InfoQ
InfoQ · 2026-01-10T12:45:00Z
DuckDB的WebAssembly客户端允许在浏览器中查询Iceberg数据集

DuckDB最近推出了与Iceberg REST Catalogs的无服务器端到端交互,用户无需基础设施设置即可在浏览器中查询、读取和写入Iceberg表。该功能基于DuckDB-Wasm,确保浏览器和本地版本执行相同逻辑,用户可通过演示访问自己的S3表,所有计算在浏览器本地运行。

DuckDB的WebAssembly客户端允许在浏览器中查询Iceberg数据集

InfoQ
InfoQ · 2026-01-04T13:00:00Z
如何在自己的数据集上微调本地Mistral或Llama 3模型

本文介绍了如何使用Unsloth和QLoRA微调开源大语言模型,以提升客户支持效率。内容包括数据集准备、训练、测试和比较。通过微调,模型在特定领域的响应速度和一致性显著提高。教程涵盖Colab环境设置、数据集准备、模型训练及性能评估等步骤。

如何在自己的数据集上微调本地Mistral或Llama 3模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-19T09:00:17Z
即使是初学者也能在Python中处理大数据集的方法

使用Python处理大数据集不需要高级技能。通过分块读取、选择特定列和优化数据类型等技术,可以有效管理超出内存限制的数据集,适合初学者,提高数据处理效率。

即使是初学者也能在Python中处理大数据集的方法

KDnuggets
KDnuggets · 2025-12-17T15:23:55Z

阿里妈妈发布MUSE:用多模态搞定十万级超长行为序列,并开源Taobao-MM数据集

机器之心
机器之心 · 2025-12-16T05:26:42Z
AI 语音数据集如何助力打造自然流畅的语音系统

近年来,AI语音技术迅速发展,依赖于高质量、多样化的语音数据集。这些数据集通过数据收集、预处理和训练,帮助AI生成自然语音,广泛应用于虚拟助手和有声读物等领域。随着技术进步,语音AI的功能和个性化不断提升,确保数据质量和多样性至关重要。

AI 语音数据集如何助力打造自然流畅的语音系统

实时互动网
实时互动网 · 2025-12-12T03:30:13Z

HyperAI 超神经为大家整理了 11.17-11.21 期间一系列极具价值且应用广泛的教程和数据集,涵盖计算机视觉、生物学、多模态等多个领域~

开源性价比最优选!Mistral AI 发布 Ministral 3 系列模型,集成多模态理解与智能执行能力;从高动态舞蹈到日常行为,X-Dance 数据集解锁人体动画生成多维度测试

HyperAI超神经
HyperAI超神经 · 2025-12-08T07:55:58Z
Fluid - 一个开源的Kubernetes原生分布式数据集调度器和…

Fluid是一个开源项目,提供Kubernetes原生的数据抽象和加速,适用于大数据和AI应用。它整合异构存储为统一的数据集,提升I/O性能和延迟,支持分布式缓存和自动化数据操作,适合大规模训练和数据分析。

Fluid - 一个开源的Kubernetes原生分布式数据集调度器和…

云原生
云原生 · 2025-12-08T07:37:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码