标签

 gpu 

相关的文章:

探索GPU在计算、AI和深度学习中的应用,涵盖最新技术、工具和解决方案,助力开发者和研究人员提升效率与性能。

使用WebGL和GLSL着色器构建自定义GPU加速粒子系统

Canvas 2D is fine for a few hundred particles, but when you want thousands — even millions — of particles moving independently, you need the GPU. In this article, we’ll build a custom particle...

使用WebGL和GLSL着色器构建高性能自定义粒子系统,支持数千至数百万粒子独立移动,能够控制粒子的物理特性、颜色和大小,尽管学习曲线陡峭,但可实现动态实时视觉效果。

使用WebGL和GLSL着色器构建自定义GPU加速粒子系统
原文英文,约500词,阅读约需2分钟。发表于:
阅读原文

人工智能数值天气模型的民主化:使用大学研究实验室的GPU进行全球预测的FourCastNetv2示例

该研究旨在解决有限资源大学研究小组在复制AI驱动的全球天气预报模型方面遇到的挑战。通过采用NVIDIA的FourCastNetv2模型和GPU,本文展示了资源受限的研究小组如何高效地进行天气预测,并探讨了数据管理、训练效率和模型验证的问题。研究表明,通过合理利用高性能计算资源,可以推动AI天气预报的民主化,为其他学术研究团队和相关课程提供指导。

发表于:
阅读原文

Nvidia的GPU驱动程序一团糟

Nvidia’s GPU drivers have been a disaster over the past four months. It all started when Nvidia released its drivers for the RTX 50-series cards in January, and introduced black screen issues,...

Nvidia的GPU驱动在过去四个月内出现严重问题,导致黑屏和游戏崩溃。虽然576.02驱动修复了一些错误,但用户仍报告新问题。Nvidia发布了576.15热修复驱动,解决部分问题,但仍存在游戏崩溃和性能下降,且至少有15个问题未解决。

Nvidia的GPU驱动程序一团糟
原文英文,约500词,阅读约需2分钟。发表于:
阅读原文
原文中文,约3900字,阅读约需10分钟。发表于:
阅读原文

可扩展的APT恶意软件分类:通过并行特征提取和GPU加速学习

本文针对恶意软件分类中的一个关键问题,即将恶意可执行文件映射到已知的高级持续性威胁(APT)组,提出了一种自动化和加速的框架。通过结合开源反向工程工具与并行计算脚本,显著提高了特征提取的效率,并采用卷积神经网络(CNNs)和GPU加速提高了分类模型的性能,克服了传统模型在处理n-gram序列时的局限性。

本文提出了一种自动化框架,旨在将恶意可执行文件映射到已知APT组。通过结合开源工具和并行计算,提高特征提取效率,并利用CNN和GPU加速分类性能,克服传统模型的局限性。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文

教程:使用谷歌云Cloud Run进行GPU加速的无服务器推理

Recently, Google Cloud launched GPU support for the Cloud Run serverless platform. This feature enables developers to accelerate serverless inference The post Tutorial: GPU-Accelerated Serverless...

谷歌云为Cloud Run无服务器平台推出GPU支持,助力开发者加速模型推理。本文介绍如何在GPU基础的Cloud Run上部署Llama 3.1大语言模型,步骤包括环境初始化、部署TGI模型服务器和推理测试。

教程:使用谷歌云Cloud Run进行GPU加速的无服务器推理
原文英文,约900词,阅读约需4分钟。发表于:
阅读原文

如何使用WebGL和JavaScript构建GPU加速的图像滤镜

WebGL is a JavaScript API that enables rendering high-performance 2D and 3D graphics directly in the browser using the GPU. In this article, we'll walk through building an image filter (like...

WebGL是一个JavaScript API,允许在浏览器中利用GPU渲染高性能的2D和3D图形。本文介绍了如何通过着色器和JavaScript构建实时图像滤镜(如灰度和模糊),实现高效的图像处理。WebGL为现代用户界面效果和照片编辑器提供了必要的速度和响应能力。

如何使用WebGL和JavaScript构建GPU加速的图像滤镜
原文英文,约500词,阅读约需2分钟。发表于:
阅读原文

A Brief Note on Multi-GPU Parallel Training of Deep Learning Models in Docker

在深度学习训练中,训练方式根据并行策略的不同分为模型并行和数据并行。 在 N 卡上使用 torch 进行数据并行训练时,又有两种不同的选择:torch.nn.DataParallel(DP)、torch.nn.DistributedDataParallel(DDP)。 今天的重点是在 Docker 中使用 torch.nn.DataParallel(DP) 进行单机多卡训练。

在深度学习中,训练方式包括模型并行和数据并行。使用torch进行数据并行时,可以选择torch.nn.DataParallel或torch.nn.DistributedDataParallel。本文主要介绍如何在Docker中使用torch.nn.DataParallel进行单机多卡训练,包括环境准备和代码调整。

A Brief Note on Multi-GPU Parallel Training of Deep Learning Models in Docker
原文英文,约1900词,阅读约需7分钟。发表于:
阅读原文

FFmpeg 的 FFV1 Vulkan 解码器在 AMD GPU 上的运行速度提高了 3 倍

上个月,一个基于 Vulkan 的 FFV1 初始解码器合并到了广泛使用的 FFmpeg 开源多媒体库中,用于 FF Video 1 无损视频编码格式。如果您有兴趣在 AMD GP...

上个月,FFmpeg 合并了基于 Vulkan 的 FFV1 解码器,使 AMD GPU 性能提升三倍。开发者 Lynne 进行了多项优化,包括在英特尔硬件上启用加速,并为 AMD 添加了缓存符号读取器。

FFmpeg 的 FFV1 Vulkan 解码器在 AMD GPU 上的运行速度提高了 3 倍
原文中文,约500字,阅读约需2分钟。发表于:
阅读原文
原文英文,约400词,阅读约需2分钟。发表于:
阅读原文