小红花·文摘 - 小红花技术领袖俱乐部

将 Florence-2 部署到 Inferentia2 的实战指南

将 Florence-2 部署到 Inferentia2 的实战指南

亚马逊AWS官方博客 ·

Amazon Inf2 上的 DeepSeek-R1 蒸馏模型：监控与评估实践

Amazon Inf2 上的 DeepSeek-R1 蒸馏模型：监控与评估实践

亚马逊AWS官方博客 ·

使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型（二）

使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型（二）

亚马逊AWS官方博客 ·

使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型（一）

使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型（一）

亚马逊AWS官方博客 ·

摆脱 GPU 资源束缚，Amazon Inf2 让大模型推理更高效

摆脱 GPU 资源束缚，Amazon Inf2 让大模型推理更高效

亚马逊AWS官方博客 ·

在 Amazon SageMaker 上使用 AWS Inferentia2 和 AWS Trainium 以最低成本实现高性能的生成式人工智能推理

在 Amazon SageMaker 上使用 AWS Inferentia2 和 AWS Trainium 以最低成本实现高性能的生成式人工智能推理

亚马逊AWS官方博客 ·

在 Amazon SageMaker 上使用 AWS Inferentia2 实现 AI 作画

在 Amazon SageMaker 上使用 AWS Inferentia2 实现 AI 作画

亚马逊AWS官方博客 ·

使用AWS Inferentia2加速Hugging Face Transformers

使用AWS Inferentia2加速Hugging Face Transformers

Hugging Face - Blog ·