小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Modular:结构化Mojo内核第4部分 - 可移植性与未来之路

Modular推出的Structured Mojo Kernels旨在提升GPU编程的可维护性和性能。该架构通过组件化设计,实现了在不同硬件上高效运行的能力。与传统方法相比,Structured Mojo Kernels显著减少了代码量,同时保持与CUTLASS相同的性能,展现了可重用性和资源管理的优势。

Modular:结构化Mojo内核第4部分 - 可移植性与未来之路

Modular Blog
Modular Blog · 2026-04-03T00:00:00Z
模块化:结构化Mojo内核第三部分 - 实践中的组合

本文讨论了结构化Mojo内核的设计,强调模块化编程的优势。通过示例展示了如何灵活替换和参数化内核组件,以适应不同的数据访问模式和数据类型,从而提高内核的维护和扩展效率,减少代码冗余和错误传播。

模块化:结构化Mojo内核第三部分 - 实践中的组合

Modular Blog
Modular Blog · 2026-03-26T00:00:00Z
模块化:2026年NVIDIA GTC上的模块化:基于Blackwell的MAX、Mojo内核移植以及B200上的DeepSeek V3

在NVIDIA GTC展会上,我们展示了基于MAX框架的FLUX图像生成和Mojo编程的CUTLASS内核移植。DeepSeek V3在云端运行,提供实时指标,欢迎到3004号展位交流。

模块化:2026年NVIDIA GTC上的模块化:基于Blackwell的MAX、Mojo内核移植以及B200上的DeepSeek V3

Modular Blog
Modular Blog · 2026-03-16T00:00:00Z
Modular:结构化Mojo内核第二部分 - 三大支柱

Modular收购BentoML,旨在提供云端AI生产解决方案。文章介绍了结构化Mojo内核架构,强调其在GPU内核中的优势,如减少代码量和提高性能。通过分离数据移动、管道协调和计算,结构化内核实现了跨硬件的可扩展性,简化了开发过程。

Modular:结构化Mojo内核第二部分 - 三大支柱

Modular Blog
Modular Blog · 2026-03-11T00:00:00Z
Modular:结构化Mojo内核 第1部分 - 峰值性能,代码量减半

Modular收购BentoML,旨在提供云端AI生产解决方案。Mojo语言通过结构化内核简化GPU编程,提升开发效率,减少代码复杂性,同时保持高性能。结构化Mojo内核将逻辑分为三个核心组件,确保清晰的接口和职责分离,降低错误率并提高可维护性。

Modular:结构化Mojo内核 第1部分 - 峰值性能,代码量减半

Modular Blog
Modular Blog · 2026-03-05T00:00:00Z

我首次与Mojo和WebSocket进行互动,记录了我的经验和体会。

Mojo与WebSocket

blogs.perl.org
blogs.perl.org · 2026-02-08T02:48:40Z
模块化:如何在没有GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

一位Mojo社区成员利用AI在Mojo中解决了量化挑战,其速度比C++/CUDA实现快1.07到1.84倍。Mojo简化了GPU编程,适合开发者使用。

模块化:如何在没有GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

Modular Blog
Modular Blog · 2026-01-14T00:00:00Z
模块化:我如何在没有任何GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

我参加了一个量化挑战,使用Mojo编程,结果比C++/CUDA实现快1.07到1.84倍。Mojo简化了GPU编程,适合开发者尝试。

模块化:我如何在没有任何GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

Modular Blog
Modular Blog · 2026-01-12T00:00:00Z
模块化:通往Mojo 1.0的道路

Mojo语言自三年前起步,现已发展至1.0版本,旨在为开发者提供高性能的CPU和GPU编程。它结合了Python语法与现代系统编程能力,促进了开发者社区的成长。1.0版本将增强稳定性,未来将推出更多功能。

模块化:通往Mojo 1.0的道路

Modular Blog
Modular Blog · 2025-12-05T00:00:00Z
模块化:模块宇宙 #52:共同推进AI — 社区项目与平台里程碑

模块宇宙正在快速发展,社区不断创新,开发者们推出了Mojo的高性能计算库和量子模拟器。模块在AI和高性能计算领域表现优异,最近的基准测试显示其性能超过CUDA。模块团队还将举办活动,欢迎参与。

模块化:模块宇宙 #52:共同推进AI — 社区项目与平台里程碑

Modular Blog
Modular Blog · 2025-12-03T00:00:00Z

该代码示例展示了如何在Postgres中通过`insert_multi_p`方法一次性插入多条记录,并结合常规的插入选项。文章还提到了一些其他有趣的方法。

我为Mojo::Pg实现了多条插入及其他方法

blogs.perl.org
blogs.perl.org · 2025-11-01T01:13:46Z

CPAN::MetaCustodian尚未更新,导致与最新版本的Perl.Wiki.html不兼容。

公告:Wikis:Perl V 1.32 和 Debian V 1.10 和 Mojo V 1.07

blogs.perl.org
blogs.perl.org · 2025-10-07T06:32:32Z

Mojo是一种新兴编程语言,旨在提高Python在AI和GPU编程中的性能。尽管语法与Python相似,但缺乏生成器和模式匹配等便利功能。Mojo采用静态类型和内存所有权模型,支持并发,但线程支持有限。性能测试表明,Mojo在多核环境下的表现约为Python的三倍。尽管存在闭源的担忧,但其潜力和与Python的互操作性令人期待。

终于尝试Mojo了🔥

Jamie's Blog
Jamie's Blog · 2025-10-01T23:00:00Z
模块化:在Nvidia Blackwell上的矩阵乘法:第一部分 - 介绍

本系列博客将展示如何在Nvidia Blackwell GPU上编写高性能矩阵乘法内核,力求达到或超越cuBLAS的性能。第一部分介绍矩阵乘法的重要性及其在大型语言模型中的应用,并用Mojo语言实现简单的矩阵乘法。后续部分将逐步优化内核性能,利用Blackwell的新硬件指令。

模块化:在Nvidia Blackwell上的矩阵乘法:第一部分 - 介绍

Modular Blog
Modular Blog · 2025-08-28T00:00:00Z
Modular:Modverse #50:Modular平台25.5、社区聚会及Mojo在Stack Overflow开发者调查中的首次亮相

过去一个月,Modular生态系统迎来了多个社区项目和里程碑。Modular Platform 25.5发布,支持大规模批量推理,成本降低80%。社区成员积极实验Gaussian splatting,构建Mojo中的概率数据结构,并举办聚会。Mojo在2025年Stack Overflow开发者调查中首次亮相,显示出快速采用。

Modular:Modverse #50:Modular平台25.5、社区聚会及Mojo在Stack Overflow开发者调查中的首次亮相

Modular Blog
Modular Blog · 2025-08-21T00:00:00Z
Modular:Modverse #49:Modular平台25.4,Modular 🤝 AMD,以及Modular Hack Weekend

上个月,Modular生态系统发布了25.4版本,与AMD建立了合作关系,支持AMD和NVIDIA硬件。新版本在BF16工作负载上提升了53%的吞吐量。全球开发者参与了Modular Hack Weekend,创造了量子模拟器和生物信息学库等项目。此外,推出了Mammoth系统,支持跨GPU的GenAI推理,Mojo内核可直接集成到Python工作流中。

Modular:Modverse #49:Modular平台25.4,Modular 🤝 AMD,以及Modular Hack Weekend

Modular Blog
Modular Blog · 2025-07-09T00:00:00Z
模块化:深入模块化黑客周末:顶尖项目与社区亮点

本周末,AI和系统编程社区的开发者参加了全球虚拟黑客马拉松,专注于Mojo和MAX的GPU编程。活动包括研讨会和项目开发,获奖项目有快速傅里叶变换、Mojo-Lapper和量子电路模拟器。感谢NVIDIA、Lambda和GPU MODE的支持。

模块化:深入模块化黑客周末:顶尖项目与社区亮点

Modular Blog
Modular Blog · 2025-07-03T00:00:00Z
Modular:Modular如何实现AI计算的民主化?(AI计算民主化,第11部分)

Modular旨在通过统一开发者、软件和硬件,解决AI软件生态的碎片化问题,推动AI技术的广泛应用。其平台包括Mojo编程语言、MAX服务框架和Mammoth集群管理,支持多种硬件,提升开发者体验。

Modular:Modular如何实现AI计算的民主化?(AI计算民主化,第11部分)

Modular Blog
Modular Blog · 2025-06-20T00:00:00Z
模块化平台25.4:一个容器,支持AMD和NVIDIA GPU,无锁定

Modular Platform 25.4正式支持AMD GPU,提升AI模型性能,降低成本,增强灵活性。新增Mojo与Python绑定,简化开发流程,欢迎开发者贡献,共同推动AI基础设施发展。

模块化平台25.4:一个容器,支持AMD和NVIDIA GPU,无锁定

Modular Blog
Modular Blog · 2025-06-18T00:00:00Z
Modular:Modverse #48:Modular Platform 25.3、MAX AI内核与Modular GPU内核黑客马拉松

五月发布了Modular Platform 25.3,包含超过45万行代码。举办了社区聚会和GPU内核黑客马拉松,吸引了100多名工程师和研究人员,分享了Mojo和MAX的最新进展。Mojo现已支持直接从Python调用,性能得到提升。社区的开源贡献持续增加。

Modular:Modverse #48:Modular Platform 25.3、MAX AI内核与Modular GPU内核黑客马拉松

Modular Blog
Modular Blog · 2025-05-29T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码