小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
Hugging Face发布FineTranslations,一个万亿标记的多语言平行文本数据集

Hugging Face发布了FineTranslations数据集,包含超过1万亿个平行文本标记,涵盖英语及500多种语言,旨在改善机器翻译,尤其是英语到低资源语言的翻译。数据集来源于FineWeb2,经过严格筛选和处理,确保质量,可通过Hugging Face访问,支持大规模处理。

Hugging Face发布FineTranslations,一个万亿标记的多语言平行文本数据集

InfoQ
InfoQ · 2026-01-18T08:00:00Z
IBM Research推出CUGA,一个基于Hugging Face的开源可配置代理框架

IBM Research推出了CUGA(可配置通用代理),旨在简化企业代理框架的评估。CUGA支持复杂的多步骤工作流,强调可靠性和恢复能力,适用于长时间任务和动态工具使用。它在生产力和客户服务等领域表现优异,并支持与LangChain等的集成,相关代码和文档已公开,欢迎开发者参与。

IBM Research推出CUGA,一个基于Hugging Face的开源可配置代理框架

InfoQ
InfoQ · 2025-12-21T16:59:00Z
使用Hugging Face和Python入门自然语言处理

Hugging Face是一个专注于自然语言处理的强大AI库,能够进行文本分析和情感分析等任务。它利用先进的模型(如GPT和BERT)提升性能,广泛应用于市场分析、客户服务和学术研究。用户可以通过简单的Python教程快速上手,体验其强大功能。

使用Hugging Face和Python入门自然语言处理

The New Stack
The New Stack · 2025-12-01T16:00:23Z
Meta和Hugging Face推出OpenEnv,一个共享的代理环境平台

Meta和Hugging Face推出了OpenEnv,一个开源项目,旨在标准化AI代理环境的创建与共享。核心是OpenEnv Hub,提供安全的代理环境,定义代理执行任务所需的工具和条件。OpenEnv 0.1规范已发布,鼓励社区反馈,开发者可在公共库中探索示例环境并进行测试。该项目促进了开源强化学习生态系统的合作,标志着开放代理的未来。

Meta和Hugging Face推出OpenEnv,一个共享的代理环境平台

InfoQ
InfoQ · 2025-11-04T11:55:00Z
Hugging Face推出了RTEB,一个用于评估检索模型的新基准

Hugging Face推出了检索嵌入基准(RTEB),旨在更准确地评估嵌入模型在实际检索任务中的泛化能力。该基准结合了公开和私有数据集,涵盖法律、医疗、金融等领域,支持多种语言,力求成为AI检索性能的社区标准。

Hugging Face推出了RTEB,一个用于评估检索模型的新基准

InfoQ
InfoQ · 2025-10-16T06:02:00Z
Hugging Face推出mmBERT,一种支持1800多种语言的多语言编码器

Hugging Face发布了mmBERT,这是一种新型多语言编码器,训练于超过3万亿个标记,涵盖1,833种语言。该模型通过渐进式训练,从60种高资源语言扩展到所有语言,显著提升了多语言理解能力,并在多个评估中超越了早期的多语言编码器,展现了高效性与覆盖率的平衡。

Hugging Face推出mmBERT,一种支持1800多种语言的多语言编码器

InfoQ
InfoQ · 2025-09-29T20:10:00Z
百度在Hugging Face发布PP-OCRv5,光学字符识别基准测试中超越VLMs

百度在Hugging Face发布了PP-OCRv5,这是一种高效的光学字符识别模型,专注于文本识别,支持多语言,适合边缘部署。尽管对其多语言能力有疑虑,但在手写和印刷文本的基准测试中表现优异。

百度在Hugging Face发布PP-OCRv5,光学字符识别基准测试中超越VLMs

InfoQ
InfoQ · 2025-09-25T17:45:00Z
Hugging Face发布FinePDFs:一个由PDF构建的3万亿标记数据集

Hugging Face发布了FinePDFs,这是最大的公开PDF语料库,包含4.75亿份文档和约3万亿个标记。该数据集利用文本提取和GPU OCR技术,解决了PDF处理的挑战,涵盖多种语言,尤其在法律和学术领域具有潜力,免费供研究使用。

Hugging Face发布FinePDFs:一个由PDF构建的3万亿标记数据集

InfoQ
InfoQ · 2025-09-15T08:55:00Z
优化Hugging Face Transformer管道的5个技巧

Hugging Face提供了五个优化Transformers Pipelines的技巧:1. 批量推理以提高GPU利用率;2. 使用低精度和量化减少内存;3. 选择高效模型架构加快推理;4. 利用缓存重用计算结果;5. 通过Optimum降低延迟。这些方法能显著提升AI应用性能。

优化Hugging Face Transformer管道的5个技巧

KDnuggets
KDnuggets · 2025-09-12T12:00:58Z
Hugging Face推出AI Sheets,一款无代码的数据集转换工具

Hugging Face推出了AI Sheets,这是一个开源应用,用户可以通过类似电子表格的界面无代码地使用AI模型来构建和转换数据集。该工具支持生成新列、清理文本和分类条目,用户可以从头创建数据集或导入现有数据,支持多种格式,并允许模型比较和自托管,以确保数据隐私。

Hugging Face推出AI Sheets,一款无代码的数据集转换工具

InfoQ
InfoQ · 2025-09-08T19:45:00Z
Hugging Face 开源 FineVision:一个包含 2400 万个样本的全新多模态数据集,用于训练视觉语言模型

Hugging Face 发布了 FineVision,一个包含 1730 万张图片和近 100 亿个答案标记的开放多模态数据集。该数据集经过严格筛选和系统评级,提升了视觉语言模型的训练质量,支持多种新兴任务,减少数据泄漏,推动研究的可重复性和可访问性。

Hugging Face 开源 FineVision:一个包含 2400 万个样本的全新多模态数据集,用于训练视觉语言模型

实时互动网
实时互动网 · 2025-09-08T02:10:58Z
Hugging Face发布Trackio,一个轻量级的开源实验跟踪库

Hugging Face推出了Trackio,一个轻量级的开源Python实验跟踪库,旨在提高集成和透明性。Trackio支持本地仪表板和与Hugging Face Spaces的同步,代码量少于1000行,易于扩展,强调可重复性和可访问性,方便研究人员记录和分享实验。尽管功能尚不完善,Hugging Face希望通过社区贡献不断改进Trackio。

Hugging Face发布Trackio,一个轻量级的开源实验跟踪库

InfoQ
InfoQ · 2025-09-02T07:55:00Z

Hugging Face推出新平台「Trending Papers」,以替代已于7月24日关闭的「Paper With Code」,引发科研人员关注与不满,担心无法继承原有资源整合模式。

科研党痛失「快乐老家」?Paper With Code宣布关闭,网友对Hugging Face新版块不买账

HyperAI超神经
HyperAI超神经 · 2025-08-13T05:24:10Z
Hugging Face推出Reachy Mini机器人,促进人机交互

Hugging Face推出了Reachy Mini机器人,适合AI开发者和研究者。该机器人高11英寸、重3.3磅,用户可自行组装,具备多种传感器和可编程功能,支持Python,未来将支持JavaScript和Scratch。Reachy Mini的硬件和软件均为开源,鼓励创新与共享。Lite版预计2025年夏季发货,无线版稍后推出。

Hugging Face推出Reachy Mini机器人,促进人机交互

InfoQ
InfoQ · 2025-07-15T10:41:00Z

自6月以来,团队在机器人领域快速推进,开发了SmolVLA模型,以提升机器人在新环境中的适应能力。该模型结合视觉、语言和动作(VLA),优化了训练和推理效率,并利用社区数据进行预训练,展现出强大的泛化能力和性能。

SmolVLA——Hugging Face等机构推出的轻量且高效的VLA:将动作执行、观测处理、动作预测解耦

结构之法 算法之道
结构之法 算法之道 · 2025-06-17T15:31:08Z
Hugging Face 发布 SmolVLA:经济高效的机器人紧凑型 VLA 模型

Hugging Face推出了SmolVLA,一个轻量级的视觉-语言-动作模型,旨在以低成本和高效能实现机器人控制。该模型基于社区数据训练,优化于单GPU或CPU环境,具备低延迟和高成功率,适用于多种机器人平台。SmolVLA的异步推理提高了控制效率,显著降低了计算需求,为未来的机器人学习研究奠定基础。

Hugging Face 发布 SmolVLA:经济高效的机器人紧凑型 VLA 模型

实时互动网
实时互动网 · 2025-06-04T02:43:33Z

250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人

机器之心
机器之心 · 2025-05-31T15:30:04Z
Hugging Face MCP课程

MCP课程是一个全面的免费指南,帮助初学者理解和构建利用外部数据和工具的先进AI应用,助力成为MCP领域的专业人士。

Hugging Face MCP课程

DEV Community
DEV Community · 2025-05-26T20:06:33Z
AI 代理实战指南:Hugging Face 全栈课程 | 开源日报 No.604

agent-squad 是一个强大的框架,用于管理 AI 代理和复杂对话,支持智能意图分类、双语言和上下文管理。agents-course 提供代理课程,涵盖基础知识和实践项目。Rowboat 是多代理构建工具,支持快速集成。Taiwan-LLM 是为台湾设计的中文语言模型,具备强大的语言处理能力。

AI 代理实战指南:Hugging Face 全栈课程 | 开源日报 No.604

开源服务指南
开源服务指南 · 2025-05-13T15:35:31Z
Hugging Face通过开源Reachy 2机器人推动机器人技术的民主化

Hugging Face收购法国初创公司Pollen Robotics,旨在通过开源人形机器人Reachy 2的设计,提升机器人技术的可获取性。Reachy 2具有人机交互和远程控制能力,适合研究开发,反映了对开源AI和机器人技术的关注,促进技术透明性与创新。

Hugging Face通过开源Reachy 2机器人推动机器人技术的民主化

InfoQ
InfoQ · 2025-05-10T10:45:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码