张小凯的博客 ·

一、并行编程导论与CUDA入门

💡 原文中文，约15000字，阅读约需36分钟。

📝

内容提要

随着人工智能的发展，CUDA在矩阵和张量计算中变得愈发重要。CUDA是NVIDIA的并行计算平台，支持C/C++语法，通过SIMT模式实现多线程并行计算。CPU负责数据准备和结果整理，GPU则进行高效的并行计算，广泛应用于深度学习和科学计算。

🎯

🏷️

Ktor 3.4.0 Is Now Available!
Ktor 3.4.0版本提升了稳定性，解决了多个问题，新增了OpenAPI生成、Zstd压缩支持和OkHttp双向流等功能。新插件可在客户端断开时取消HT...
人工智能的年份：监管行业即将迎来的三大关键转变
到2025年，高度监管行业的企业将评估AI能力，识别可行用例，推动大规模AI实施，主要包括加速遗留系统现代化、预测安全操作和扩展开发能力。这将提升组织效率...
2.4万亿参数“最强文科生”，文心5.0正式版，你挺懂山东人啊？
文心5.0正式发布，参数达到2.4万亿，具备全模态能力，表现优异。其在文本和视觉理解方面多次夺冠，展现出强大的知识整合与创造力。通过原生全模态建模，提升了...
2026年1月MySQL性能评估
本文分析了Community MySQL、Percona Server和MariaDB的最新性能基准测试。结果显示，Percona Server与MySQ...
Exposed 1.0 现已发布
Exposed 1.0发布，支持R2DBC和Spring Boot 3/4，提升性能和API稳定性。感谢社区贡献，期待未来发展。
Vercel、Heroku 和 Netlify 的五大自托管平台替代方案
本文介绍了几种自托管平台，如Dokploy、Coolify、Appwrite、Dokku和Juno，旨在帮助开发者简化应用部署和管理，避免复杂的DevOp...