小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

OpenVINO2025支持多种模型加速方式,如异步流水线和量化技术,使YOLO11模型推理速度提升至200+FPS,并提供C++ SDK以便于高效推理的实现。

【唯快不破】OpenVINO2025实现CPU上YOLO11推理超200+FPS

gloomyfish
gloomyfish · 2025-06-24T03:56:25Z

本文介绍了多种基于稀疏性的深度学习加速方法,如SparseRT、N:M稀疏性训练和Channel-aware动态稀疏。这些方法在保持模型精度的同时,显著提升了计算速度和效率,适用于大型语言模型和现代硬件,解决了模型部署中的参数和内存问题。

混合稀疏训练:实现变压器预训练的4倍FLOP减少

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z
玩转大语言模型:文本生成和模型控制的革新之道 | 开源日报 0901

Guidance 是一个强大的开源工具,旨在帮助开发者和设计师更有效地控制现代语言模型。它使用简单的 Handlebars 模板语法,实现文本生成和逻辑控制,支持 Jupyter/VSCode 的实时流式处理,提升开发效率,并提供模型加速功能,优化生成速度,适用于自然语言生成和文本处理。

玩转大语言模型:文本生成和模型控制的革新之道 | 开源日报 0901

开源服务指南
开源服务指南 · 2023-11-23T06:04:53Z
Hugging Face和AMD合作加速CPU和GPU平台的最先进模型

Hugging Face和AMD合作,加速CPU和GPU平台的最先进模型,支持自然语言处理、计算机视觉和语音等最先进的转换器架构,如BERT、DistilBERT、ROBERTA、Vision Transformer、CLIP和Wav2Vec2。他们还将支持更传统的计算机视觉模型,如ResNet和ResNext,以及深度学习推荐模型。他们将与AMD工程团队密切合作,优化关键模型,以利用最新的AMD硬件和软件功能提供最佳性能。

Hugging Face和AMD合作加速CPU和GPU平台的最先进模型

Hugging Face - Blog
Hugging Face - Blog · 2023-06-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码