小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
解锁高效模型部署:在 Amazon SageMaker HyperPod 上简化推理操作符设置

Amazon SageMaker HyperPod 提供全面的 AI 开发生命周期支持,包括实验、训练和推理。新推出的 HyperPod 推理操作符简化了模型部署,支持一键安装和管理升级,消除了复杂配置需求。用户可通过 SageMaker 控制台、CLI 或 Terraform 快速部署推理工作负载,提高效率,降低复杂性。

解锁高效模型部署:在 Amazon SageMaker HyperPod 上简化推理操作符设置

AWS Architecture Blog
AWS Architecture Blog · 2026-04-06T21:14:13Z
Qwen3.5 选型 + vLLM 部署实战:从 0.8B 到 397B,哪款最适合你?

本文介绍了阿里云开源大语言模型Qwen3.5的选择与部署,提供从0.8B到397B的多种规格,适用于不同场景。推荐型号包括27B、35B-A3B和397B-A17B,分别在代码能力、性价比和综合性能上表现优异。文章还说明了如何在Kubernetes环境中使用vLLM进行模型部署及性能测试。

Qwen3.5 选型 + vLLM 部署实战:从 0.8B 到 397B,哪款最适合你?

探索云原生
探索云原生 · 2026-03-30T20:00:00Z
vLLM 部署 GLM-5 实践指南

本文介绍了如何在生产环境中使用 vLLM 部署 GLM-5 模型,包括模型下载、镜像构建和 Docker 部署。GLM-5 是智谱 AI 最新的大语言模型,具备强大的推理能力。文章详细说明了安装 HuggingFace CLI、下载模型、构建自定义镜像及服务验证等步骤,并提供了性能基准测试结果,显示 INT4 版本在特定环境下的高吞吐量。

vLLM 部署 GLM-5 实践指南

探索云原生
探索云原生 · 2026-03-25T20:00:00Z
MLOps框架:生产机器学习工具和平台的完整指南

MLOps框架旨在解决机器学习模型从实验到可靠部署的挑战,涵盖实验跟踪、模型版本控制、工作流编排、模型部署和监控等核心领域。选择合适的框架(如MLflow、Kubeflow和Metaflow)可以提升模型的业务价值,满足不同团队的需求。

MLOps框架:生产机器学习工具和平台的完整指南

Databricks
Databricks · 2026-03-20T23:10:00Z
如何在本地构建端到端的机器学习平台:从实验跟踪到CI/CD

机器学习项目的成功不仅依赖于模型训练,还需可靠的部署和维护。许多系统在生产中失败,原因包括代码不一致、数据变化和预处理错误。为解决这些问题,需要工程化的方法,如可重复的管道、验证、版本控制和监控。本手册以欺诈检测为例,指导读者构建完整的机器学习平台,涵盖从模型训练到部署的全过程。使用Python工具,如MLflow进行实验跟踪,Feast确保特征一致性,Great Expectations进行数据验证,Evidently监控模型性能,Docker实现环境一致性,GitHub Actions实现CI/CD自动化。最终,读者将拥有一个生产就绪的机器学习管道,能够自信地进行测试、监控和迭代。

如何在本地构建端到端的机器学习平台:从实验跟踪到CI/CD

freeCodeCamp.org
freeCodeCamp.org · 2026-03-17T20:33:56Z
基于 .NET 的 YOLO 多模型推理平台开源了

本文介绍了一个深度学习模型部署测试平台,支持YOLOv5至YOLOv13模型,兼容OpenVINO和ONNX Runtime推理引擎,简化了模型部署流程,提供图形化界面,适合算法验证和性能评估。

基于 .NET 的 YOLO 多模型推理平台开源了

dotNET跨平台
dotNET跨平台 · 2026-03-03T23:58:07Z
从零部署 YOLO26:OpenVINO™ C# API 项目实战(附完整代码)

本文是一个实战教程,介绍如何使用OpenVINO™ C# API 3.2实现YOLO26目标检测项目,内容包括环境搭建、模型部署、推理和优化,适合C#开发者和计算机视觉工程师。通过六个演示,您将掌握模型部署流程和性能优化技巧。

从零部署 YOLO26:OpenVINO™ C# API 项目实战(附完整代码)

dotNET跨平台
dotNET跨平台 · 2026-02-28T00:02:18Z
低延迟实时语音识别(ASR)模型部署实践与选型

本文探讨了低延迟实时语音识别(ASR)模型的部署与选型,分析了实时ASR的业务需求和技术平台选择。重点比较了Whisper Large-v3 Turbo、Voxtral Mini和NVIDIA Parakeet三种模型的性能,推荐在生产环境中结合NVIDIA推理GPU与SageMaker实时端点,以优化资源利用率和降低成本。

低延迟实时语音识别(ASR)模型部署实践与选型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-01-21T05:09:40Z
机器学习从业者的FastAPI模型部署指南

本文介绍如何使用FastAPI将训练好的机器学习模型封装为HTTP API,包括模型的训练、保存、加载,创建FastAPI应用、输入验证、预测端点和健康检查等步骤。通过FastAPI,用户可以方便地部署模型并进行预测,提高机器学习应用的可用性。

机器学习从业者的FastAPI模型部署指南

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-20T11:00:14Z
基于华为开发者空间云主机——5分钟让华为云主机加持 DeepSeek

华为开发者空间为全球开发者提供云主机和开发工具,支持DeepSeek模型的部署与应用。适合企业研发团队和高校师生,预计耗时60分钟,包括环境搭建和模型交互等步骤。

基于华为开发者空间云主机——5分钟让华为云主机加持 DeepSeek

华为云官方博客
华为云官方博客 · 2025-12-19T12:30:00Z
Transformers v5引入了更模块化和互操作的核心

Hugging Face发布了Transformers v5的首个候选版本,强调互操作性和简化,采用模块化架构,主要支持PyTorch。新增的“transformers serve”组件便于模型部署,量化成为重要概念,旨在巩固Transformers作为开放AI开发的基础设施。

Transformers v5引入了更模块化和互操作的核心

InfoQ
InfoQ · 2025-12-16T16:45:00Z
掌握机器学习部署的10个GitHub资源

本文介绍了10个GitHub资源,帮助学习者掌握机器学习模型的部署技能,涵盖模型打包到云部署的各个方面,适合希望将实验转化为实际应用的学习者。

掌握机器学习部署的10个GitHub资源

KDnuggets
KDnuggets · 2025-12-11T15:10:18Z
软通华方为金融数字化转型铺就智算护城河

软通华方专注于金融领域,提供全栈智能技术,支持金融数字化转型。其AI算力资源满足高频交易和大模型训练需求,推出超炫1600产品,支持本地AI模型部署,已服务150多家银行和50多家保险机构,助力AI落地。

软通华方为金融数字化转型铺就智算护城河

全球TMT-美通国际
全球TMT-美通国际 · 2025-12-09T09:17:57Z
使用 Microsoft Agent Framework 构建你的第一个 Agent 应用

在构建智能体之前,需要部署模型,可以选择云端或本地模型。本文以Azure AI Foundry为例,介绍模型部署、API访问和身份认证。使用AzureCliCredential访问GPT-4o模型,示例代码展示如何创建对话型智能体并生成诗歌。

使用 Microsoft Agent Framework 构建你的第一个 Agent 应用

dotNET跨平台
dotNET跨平台 · 2025-11-15T00:03:18Z

本文探讨了构建兼容OpenAI API的原因,包括成本、数据隐私和内部模型部署。通过FastAPI,可以创建本地API服务器,模拟OpenAI接口,支持流式和非流式输出。文章提供了从零开始构建API的步骤,帮助开发者理解其结构与运作,灵活整合各种LLM服务。

打造屬於你的 OpenAI 相容 API:用 FastAPI 模擬 Chat Completions 服務

1010Code
1010Code · 2025-11-01T16:00:00Z
DeploySharp开源发布:让C#部署深度学习模型更加简单

DeploySharp是为C#开发者设计的跨平台模型部署框架,提供模型加载、配置管理和推理执行解决方案,支持多种推理引擎,兼容.NET生态,具备高性能推理能力,项目开源并遵循Apache 2.0协议。

DeploySharp开源发布:让C#部署深度学习模型更加简单

dotNET跨平台
dotNET跨平台 · 2025-10-04T00:00:55Z

华为的ModelArts是一个适合个人开发者和学生的AI开发平台,提供数据处理和模型部署功能。用户可通过华为云登录,部署模型并进行测试,使用CodeArts IDE编写代码,实现模型调用和预测。

新手友好!ModelArts 部署 + CodeArts IDE 调用,商品商超识别模型快速落地

华为云官方博客
华为云官方博客 · 2025-09-11T06:52:27Z

YOLO系列算法在目标检测中表现出色,YOLOv8的发布进一步提升了性能。基于WinForm的项目实现了YOLOv8模型的高效部署,支持多种推理后端,用户可通过图形界面轻松操作,满足实时检测需求,增强了模型的实用性和可用性。

C# 部署 Yolov8 全攻略:OpenVINO 与 TensorRT 双引擎加速

dotNET跨平台
dotNET跨平台 · 2025-08-26T23:54:38Z
每个MLOps工程师都应该了解的10个Python库

本文介绍了10个关键的Python库,支持MLOps的核心任务,如实验跟踪、数据版本控制和模型部署,包括MLflow、DVC和Kubeflow等,旨在提升机器学习模型的管理和监控效率。

每个MLOps工程师都应该了解的10个Python库

KDnuggets
KDnuggets · 2025-08-04T14:00:42Z
Latent AI 推出代理平台,实现边缘 AI 规模化自动化

Latent AI推出了首个代理边缘AI平台“Latent Agent”,旨在简化AI模型的部署与管理。该平台能够自动优化和监控模型,将部署时间缩短至数小时,降低专业知识需求,支持多种硬件,并提供安全功能,方便开发者访问边缘AI。

Latent AI 推出代理平台,实现边缘 AI 规模化自动化

实时互动网
实时互动网 · 2025-06-25T03:18:21Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码