在 AWS 上通过宝塔面板私有化部署 DeepSeek-R1 蒸馏模型

本文通过在 Amazon EC2 上使用宝塔面板私有化部署蒸馏后的 DeepSeek-R1 模型。这个方案易于搭建，支持在北京 BJS 以及宁夏 ZHY 区域部署，让您轻松体验私有化的 DeepSeek 模型。

亚马逊云科技推出 DeepSeek V3 和 R1 模型，支持在 Amazon Bedrock 和 SageMaker AI 部署。本文介绍如何在 EC2 上使用宝塔面板私有化部署 DeepSeek-R1 模型，步骤包括启动实例、安装宝塔面板、配置安全组和安装 OpenWebUI，以便用户与模型对话。

DeepSeek EC2 R1模型 aws deepseek-r1 宝塔宝塔面板私有化部署

原文中文，约3300字，阅读约需8分钟。发表于：。

阅读原文

分享给好友

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

deepseek-r1

发表于：。

阅读原文

分享给好友

Sebastian Raschka长文：DeepSeek-R1、o3背后，RL推理训练正悄悄突破上限

deepseek-r1 o3

发表于：。

阅读原文

分享给好友

DeepSeek-R1 API：开启智能未来的强大引擎

在人工智能技术飞速发展的今天，企业需要更高效、更智能的解决方案来提升业务竞争力。DeepSeek-R1 API 作为新一代AI接口服务，凭借其卓越的自然语言处理（NLP）能力、强大的计算性能和灵活的集成方式，正在成为开发者与企业智能化升级的首选工具。 DeepSeek-R1 API：开启智能未来的强大引擎最先出现在APISpace。

DeepSeek-R1 API是一款高性能的AI接口，具备强大的自然语言处理能力，适用于智能客服、内容创作和代码辅助。其低延迟和高可用性帮助企业快速接入，提升业务效率，推动智能化转型。

AI接口 api deepseek-r1 业务效率智能化转型智能客服自然语言处理

原文中文，约2000字，阅读约需5分钟。发表于：。

阅读原文

分享给好友

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

LiveCodeBench达到SOTA水平

华为的盘古Ultra模型在数学和编程任务中表现出色，参数量为135B，训练过程中未使用英伟达技术，且无损失尖峰。其改进的架构和优化策略使算力利用率超过52%。在多个基准任务中，盘古Ultra超越了其他大型模型，展现了卓越的语言理解和推理能力。

deepseek-r1 华为推理能力模型盘古Ultra 英伟达语言理解集群

原文中文，约3200字，阅读约需8分钟。发表于：。

阅读原文

分享给好友

智谱深夜开源新一代GLM模型，推理速度快DeepSeek-R1八倍，还启用了全新域名Z.ai

智谱宣布其核心技术链路完全开源，推出GLM-4-32B和GLM-Z1系列新模型，支持实时代码生成和深度分析。这些模型在推理性能和成本上表现优异，适合企业应用，推动AI普惠。

AI普惠 ai deepseek-r1 glm 域名开源推理性能新模型智谱

智谱深夜开源新一代GLM模型，推理速度快DeepSeek-R1八倍，还启用了全新域名Z.ai

原文中文，约3700字，阅读约需9分钟。发表于：。

阅读原文

分享给好友

Amazon Inf2 上的 DeepSeek-R1 蒸馏模型：监控与评估实践

客户部署自己的大模型时，常常会遇到如何评估模型部署的性能和如何调优的问题，本篇主要针对如何评估性能进行讨论。基于 vllm 部署的模型，通过 Prometheus 和 Grafana 如何取得模型推理的性能参数，以及如何解读这些参数进行讨论。本文采用 inferentia2 作为测试环境，因为本篇的目的主要是解读性能参数，在这篇里不会讨论 inferentia2 的规格和运行配置进行优化。

DeepSeek-R1模型将在2025年春节发布，用户可通过亚马逊云科技多种方式部署。文章探讨了如何评估模型推理性能，使用Inferentia2作为测试环境，并介绍了vLLM与NxD推理库的集成与监控方法，强调了性能指标的重要性。

DeepSeek-R1 Inferentia2 NxD vLLM 推理性能

原文中文，约18400字，阅读约需44分钟。发表于：。

阅读原文

分享给好友

最强32B中文推理大模型易主：开源免费商用，1/20 DeepSeek-R1参数量SOTA，权重代码数据集全开源

Skywork-OR1系列模型发布，包含三款开源模型，参数量为32B，推理能力强，支持免费商用。Skywork-OR1-32B在数学和编程方面表现优异，性价比高，接近DeepSeek-R1。模型权重和数据集已上传至GitHub，正式版本预计两周内发布。

Skywork-OR1 deepseek-r1 大模型开源模型推理能力数学数据集编程

原文中文，约5400字，阅读约需13分钟。发表于：。

阅读原文

分享给好友

DeepSeek-R1 API：引领自然语言处理的新趋势

在人工智能飞速发展的今天，自然语言处理（NLP）技术正深刻改变着我们的生活和工作方式。DeepSeek-R1 API 作为一款高性能的 NLP 模型接口，凭借其强大的功能和灵活的接入方式，正成为众多开发者和企业构建智能应用的首选工具。 DeepSeek-R1 API：引领自然语言处理的新趋势最先出现在APISpace。

DeepSeek-R1 API 是一款高性能自然语言处理工具，支持多轮对话、多语言处理、代码生成和知识问答，适用于学术研究、文案创作和教育培训，助力用户高效解决复杂问题。

api deepseek-r1 代码生成多轮对话智能应用知识问答自然语言处理

原文中文，约2300字，阅读约需6分钟。发表于：。

阅读原文

分享给好友

200B参数击败满血DeepSeek-R1，字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动推出了新推理模型Seed-Thinking-v1.5，参数总量200B，激活20B，性能超越671B的DeepSeek-R1。该模型在多个基准测试中表现优异，特别是在STEM领域和编程任务中展现出强大的推理能力。团队还开发了新的评估基准，未来将向公众开放。

STEM Seed-Thinking-v1.5 deepseek-r1 字节跳动推理模型编程任务豆包

200B参数击败满血DeepSeek-R1，字节豆包推理模型Seed-Thinking-v1.5要来了

原文中文，约4400字，阅读约需11分钟。发表于：。

阅读原文

分享给好友