小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
Google AI 发布 WAXAL:用于训练自动语音识别和文本转语音模型的多语言非洲语音数据集

WAXAL是一个开放的多语言语音数据集,涵盖24种非洲语言,专为自动语音识别(ASR)和文本转语音(TTS)设计。ASR部分通过图像提示自然采集语音,TTS部分在录音棚中高质量录制,确保语音一致性。

Google AI 发布 WAXAL:用于训练自动语音识别和文本转语音模型的多语言非洲语音数据集

实时互动网
实时互动网 · 2026-03-19T02:10:27Z
基于Gemini处理150国新闻,谷歌开源洪水数据集Groundsource,覆盖超260万历史记录

洪水是常见且破坏性强的自然灾害,研究需依赖高质量的历史数据。Google Research 开源的 Groundsource 数据集,通过处理500万篇新闻,提取了260万条洪水事件记录,填补了传统数据库的不足,为全球洪水研究提供了新的数据来源。

基于Gemini处理150国新闻,谷歌开源洪水数据集Groundsource,覆盖超260万历史记录

HyperAI超神经
HyperAI超神经 · 2026-03-18T08:23:48Z

高质量葡萄酒更可能被视为共识异常值。某些情况下,过高的挥发酸导致酒味酸涩,评分低,成为异常值。化学因素影响结果,但无法解释所有情况,可能存在未发现的模式或混杂因素。

我们对一个真实数据集使用了5种异常值检测方法:它们在96%的标记样本上存在分歧

KDnuggets
KDnuggets · 2026-03-13T14:00:48Z
低延迟、多语种、轻量化,Voxtral Realtime 打破 ASR 全场景桎梏;可穿戴设备设计福音!Antenna Performance 构建天线性能与故障数据集

Mistral AI于2026年2月开源了Voxtral Mini 4B Realtime 2602模型,支持13种语言的实时语音转录,延迟低于500毫秒,适合轻量化应用,并可在边缘计算单元上部署,提升语音识别的精度与效率。

低延迟、多语种、轻量化,Voxtral Realtime 打破 ASR 全场景桎梏;可穿戴设备设计福音!Antenna Performance 构建天线性能与故障数据集

HyperAI超神经
HyperAI超神经 · 2026-03-13T08:23:29Z
mAceReason-Math:高质量多语言数学问题数据集,适用于RLVR

当前的大型语言模型主要以英语为主,尽管支持多语言,但在非英语语言中仍表现出明显的偏见,输出不自然,反映了英语的词汇和语法模式。

mAceReason-Math:高质量多语言数学问题数据集,适用于RLVR

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-13T00:00:00Z
真·养虾!3步让龙虾边聊边进化,不用GPU不用数据集就能强化学习

MetaClaw通过在线强化学习系统,使AI在与用户对话中自动学习和进化,无需GPU和数据集。用户只需简单配置,AI即可实时优化表现并生成新技能,降低了持续学习的门槛。

真·养虾!3步让龙虾边聊边进化,不用GPU不用数据集就能强化学习

量子位
量子位 · 2026-03-12T05:14:14Z
MOSS-TTS:基于 CAT 架构的解耦式生产级语音生成模型;打破单细胞分析壁垒:Pan-Cancer scRNA-Seq 数据集构建跨癌种免疫图谱基准

MOSS-TTS系列是MOSI.AI与OpenMOSS联合推出的多模型语音生成工具,克服了单一模型在复杂场景中的局限,支持高保真语音、对话和实时交互,适用于多种语言和风格切换。

MOSS-TTS:基于 CAT 架构的解耦式生产级语音生成模型;打破单细胞分析壁垒:Pan-Cancer scRNA-Seq 数据集构建跨癌种免疫图谱基准

HyperAI超神经
HyperAI超神经 · 2026-03-06T06:01:17Z

来自美国能源部橡树岭国家实验室的科学家们提出了一种面向基础模型的分布式跨通道分层聚合方法(D-CHAG),该方法对 token 化过程进行分布式处理,并采用分层策略进行通道聚合,从而使极大规模模型能够在多通道数据集上运行。

内存占用最高降低75%,美国能源部科学家提出跨通道分层聚合方法D-CHAG,实现极大规模模型多通道数据集运行

HyperAI超神经
HyperAI超神经 · 2026-02-11T08:16:45Z

这是一个由北京通用人工智能研究院 BIGAI 于 2025 年发布的一个面向具身智能(Embodied AI)研究的开源模拟环境与资产数据集,包含了超过 25,877 个不同的操作任务场景和 100 个高质量三维模拟场景,覆盖多房间室内环境与完整的室外城市场景,所有场景均可在 60 FPS 以上稳定运行,同时提供 3,000 余个可交互三维物体,涵盖 500 余类物品类别,并包含 10...

数据集汇总丨16个具身智能数据集,覆盖抓握/问答/逻辑推理/轨迹推理等领域

HyperAI超神经
HyperAI超神经 · 2026-02-05T03:30:12Z
在Python中处理十亿行数据集(使用Vaex)

Vaex是一个高性能的Python库,专为处理超大数据集而设计。它通过外存处理和延迟计算,避免将整个数据集加载到内存中,实现快速分析,特别适合处理超过1GB的大数据。

在Python中处理十亿行数据集(使用Vaex)

KDnuggets
KDnuggets · 2026-02-02T17:00:24Z

DiagAgent 是由上海交通大学和上海人工智能实验室的 AI4Med 团队发布的诊断智能体(7B、8B、14B),能够主动管理诊断轨迹,选择最具信息量的检查、决定何时停止检查并给出准确的最终诊断。仅需约 13 GB 显存即可在消费级 GPU 上高效运行,并支持 FP8/NVFP4 量化,速度进一步提升最高 2.7 倍,将 AI...

FLUX.2‑klein‑4B:步数蒸馏实现 4 步亚秒级图像生成,在消费级 GPU 上体验实时交互;Vehicles OpenImages 数据集:专注车辆检测与定位

HyperAI超神经
HyperAI超神经 · 2026-02-02T08:33:47Z

Nemotron Speech Streaming ASR 是由英伟达(NVIDIA)Nemotron Speech 团队发布的流式自动语音识别模型,该模型专为低延迟实时语音转写场景设计,同时具备高吞吐的批量推理能力,适用于语音助手、实时字幕、会议转录及对话式人工智能等应用。模型参数规模仅 70 亿(7B),但在真实网页操作任务中表现突出,在多项 Web Agent...

TRELLIS.2:采用 O-Voxel 技术,高效生成复杂 3D 几何与材质;Patient Churn Prediction 数据集:帮助识别有流失风险的患者

HyperAI超神经
HyperAI超神经 · 2026-01-26T07:49:18Z

本文系统整理了一批具身智能相关的高质量数据集、在线教程、论文,为进一步学习和研究提供参考,欢迎前往 hyper.ai 探索更多优质资源!

具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文

HyperAI超神经
HyperAI超神经 · 2026-01-23T06:09:46Z

其研究背景源于灵巧抓取在杂乱场景下的高成功率需求,特别是在未见过的物体、光照及背景组合下实现超过 90% 的成功率,此框架采用预训练的视觉-语言模型作为高层任务规划器,并学习基于扩散的策略作为低层行动控制器,其创新之处在于利用基础模型实现强大的泛化能力,并使用基于扩散的模仿学习获取灵巧行动。Fast-ThinkAct 通过从教师模型中蒸馏潜在...

具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文……

HyperAI超神经
HyperAI超神经 · 2026-01-23T04:03:34Z
我们在同一数据集上调优了四种分类器:没有一个真正改善

对葡萄牙学生表现数据进行四种分类器的超参数调优实验表明,调优未显著提升模型性能,反而略有下降。这表明默认设置在许多情况下已足够有效,强调了在机器学习中了解何时停止调优的重要性。

我们在同一数据集上调优了四种分类器:没有一个真正改善

KDnuggets
KDnuggets · 2026-01-20T15:00:39Z

九坤投资旗下至知创新研究院开源发布IQuest-Coder-V1代码大模型,该模型基于"代码流"思想,通过分析真实代码变更历史提升生成质量,支持128K长上下文处理。同时,HyperAI官网更新了包括vLLM部署教程、QwenLong-L1.5长文本模型及Qwen-Image-2512图像生成模型等资源,并收录AI百科词条和学术会议信息,为开发者提供一站式AI资源平台。

IQuest-Coder-V1:基于代码流训练的编程逻辑增强模型;Human Face Emotions:基于多标注维度的人脸情绪识别数据集

HyperAI超神经
HyperAI超神经 · 2026-01-19T09:10:46Z
Hugging Face发布FineTranslations,一个万亿标记的多语言平行文本数据集

Hugging Face发布了FineTranslations数据集,包含超过1万亿个平行文本标记,涵盖英语及500多种语言,旨在改善机器翻译,尤其是英语到低资源语言的翻译。数据集来源于FineWeb2,经过严格筛选和处理,确保质量,可通过Hugging Face访问,支持大规模处理。

Hugging Face发布FineTranslations,一个万亿标记的多语言平行文本数据集

InfoQ
InfoQ · 2026-01-18T08:00:00Z
生产环境中大数据集的分页:为何OFFSET失效而游标更胜一筹

MVP与生产就绪应用的区别在于细节和最后20%的工作。文章探讨了在大数据集上进行分页的问题,指出缺少索引和偏移分页会导致性能下降。通过采用基于游标的分页方式并添加索引,可以显著提升查询速度和用户体验。Sentry工具用于监测数据库查询性能,确保系统在实际使用中的表现良好。

生产环境中大数据集的分页:为何OFFSET失效而游标更胜一筹

Sentry Blog
Sentry Blog · 2026-01-15T00:00:00Z
NVIDIA发布开放模型、数据集和工具,涵盖人工智能、机器人和自动驾驶领域

NVIDIA发布了一系列开放模型、数据集和开发工具,涵盖语言、机器人和自动驾驶等领域。新模型包括Nemotron系列的语音识别和安全组件,以及支持感知和推理的Cosmos基础模型,还有专注于推理的Alpamayo自动驾驶模型。所有资源可通过GitHub和Hugging Face获取。

NVIDIA发布开放模型、数据集和工具,涵盖人工智能、机器人和自动驾驶领域

InfoQ
InfoQ · 2026-01-10T12:45:00Z
DuckDB的WebAssembly客户端允许在浏览器中查询Iceberg数据集

DuckDB最近推出了与Iceberg REST Catalogs的无服务器端到端交互,用户无需基础设施设置即可在浏览器中查询、读取和写入Iceberg表。该功能基于DuckDB-Wasm,确保浏览器和本地版本执行相同逻辑,用户可通过演示访问自己的S3表,所有计算在浏览器本地运行。

DuckDB的WebAssembly客户端允许在浏览器中查询Iceberg数据集

InfoQ
InfoQ · 2026-01-04T13:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码