小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Modular:结构化Mojo内核第4部分 - 可移植性与未来之路

Modular推出的Structured Mojo Kernels旨在提升GPU编程的可维护性和性能。该架构通过组件化设计,实现了在不同硬件上高效运行的能力。与传统方法相比,Structured Mojo Kernels显著减少了代码量,同时保持与CUTLASS相同的性能,展现了可重用性和资源管理的优势。

Modular:结构化Mojo内核第4部分 - 可移植性与未来之路

Modular Blog
Modular Blog · 2026-04-03T00:00:00Z
模块化:结构化Mojo内核第三部分 - 实践中的组合

本文讨论了结构化Mojo内核的设计,强调模块化编程的优势。通过示例展示了如何灵活替换和参数化内核组件,以适应不同的数据访问模式和数据类型,从而提高内核的维护和扩展效率,减少代码冗余和错误传播。

模块化:结构化Mojo内核第三部分 - 实践中的组合

Modular Blog
Modular Blog · 2026-03-26T00:00:00Z
模块化:2026年NVIDIA GTC上的模块化:基于Blackwell的MAX、Mojo内核移植以及B200上的DeepSeek V3

在NVIDIA GTC展会上,我们展示了基于MAX框架的FLUX图像生成和Mojo编程的CUTLASS内核移植。DeepSeek V3在云端运行,提供实时指标,欢迎到3004号展位交流。

模块化:2026年NVIDIA GTC上的模块化:基于Blackwell的MAX、Mojo内核移植以及B200上的DeepSeek V3

Modular Blog
Modular Blog · 2026-03-16T00:00:00Z
Modular:结构化Mojo内核第二部分 - 三大支柱

Modular收购BentoML,旨在提供云端AI生产解决方案。文章介绍了结构化Mojo内核架构,强调其在GPU内核中的优势,如减少代码量和提高性能。通过分离数据移动、管道协调和计算,结构化内核实现了跨硬件的可扩展性,简化了开发过程。

Modular:结构化Mojo内核第二部分 - 三大支柱

Modular Blog
Modular Blog · 2026-03-11T00:00:00Z
Modular:结构化Mojo内核 第1部分 - 峰值性能,代码量减半

Modular收购BentoML,旨在提供云端AI生产解决方案。Mojo语言通过结构化内核简化GPU编程,提升开发效率,减少代码复杂性,同时保持高性能。结构化Mojo内核将逻辑分为三个核心组件,确保清晰的接口和职责分离,降低错误率并提高可维护性。

Modular:结构化Mojo内核 第1部分 - 峰值性能,代码量减半

Modular Blog
Modular Blog · 2026-03-05T00:00:00Z

我首次与Mojo和WebSocket进行互动,记录了我的经验和体会。

Mojo与WebSocket

blogs.perl.org
blogs.perl.org · 2026-02-08T02:48:40Z
模块化:如何在没有GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

一位Mojo社区成员利用AI在Mojo中解决了量化挑战,其速度比C++/CUDA实现快1.07到1.84倍。Mojo简化了GPU编程,适合开发者使用。

模块化:如何在没有GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

Modular Blog
Modular Blog · 2026-01-14T00:00:00Z
模块化:我如何在没有任何GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

我参加了一个量化挑战,使用Mojo编程,结果比C++/CUDA实现快1.07到1.84倍。Mojo简化了GPU编程,适合开发者尝试。

模块化:我如何在没有任何GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

Modular Blog
Modular Blog · 2026-01-12T00:00:00Z
模块化:通往Mojo 1.0的道路

Mojo语言自三年前起步,现已发展至1.0版本,旨在为开发者提供高性能的CPU和GPU编程。它结合了Python语法与现代系统编程能力,促进了开发者社区的成长。1.0版本将增强稳定性,未来将推出更多功能。

模块化:通往Mojo 1.0的道路

Modular Blog
Modular Blog · 2025-12-05T00:00:00Z
模块化:模块宇宙 #52:共同推进AI — 社区项目与平台里程碑

模块宇宙正在快速发展,社区不断创新,开发者们推出了Mojo的高性能计算库和量子模拟器。模块在AI和高性能计算领域表现优异,最近的基准测试显示其性能超过CUDA。模块团队还将举办活动,欢迎参与。

模块化:模块宇宙 #52:共同推进AI — 社区项目与平台里程碑

Modular Blog
Modular Blog · 2025-12-03T00:00:00Z

该代码示例展示了如何在Postgres中通过`insert_multi_p`方法一次性插入多条记录,并结合常规的插入选项。文章还提到了一些其他有趣的方法。

我为Mojo::Pg实现了多条插入及其他方法

blogs.perl.org
blogs.perl.org · 2025-11-01T01:13:46Z

CPAN::MetaCustodian尚未更新,导致与最新版本的Perl.Wiki.html不兼容。

公告:Wikis:Perl V 1.32 和 Debian V 1.10 和 Mojo V 1.07

blogs.perl.org
blogs.perl.org · 2025-10-07T06:32:32Z

Mojo是一种新兴编程语言,旨在提高Python在AI和GPU编程中的性能。尽管语法与Python相似,但缺乏生成器和模式匹配等便利功能。Mojo采用静态类型和内存所有权模型,支持并发,但线程支持有限。性能测试表明,Mojo在多核环境下的表现约为Python的三倍。尽管存在闭源的担忧,但其潜力和与Python的互操作性令人期待。

终于尝试Mojo了🔥

Jamie's Blog
Jamie's Blog · 2025-10-01T23:00:00Z
模块化:在Nvidia Blackwell上的矩阵乘法:第一部分 - 介绍

本系列博客将展示如何在Nvidia Blackwell GPU上编写高性能矩阵乘法内核,力求达到或超越cuBLAS的性能。第一部分介绍矩阵乘法的重要性及其在大型语言模型中的应用,并用Mojo语言实现简单的矩阵乘法。后续部分将逐步优化内核性能,利用Blackwell的新硬件指令。

模块化:在Nvidia Blackwell上的矩阵乘法:第一部分 - 介绍

Modular Blog
Modular Blog · 2025-08-28T00:00:00Z
Modular:Modverse #50:Modular平台25.5、社区聚会及Mojo在Stack Overflow开发者调查中的首次亮相

过去一个月,Modular生态系统迎来了多个社区项目和里程碑。Modular Platform 25.5发布,支持大规模批量推理,成本降低80%。社区成员积极实验Gaussian splatting,构建Mojo中的概率数据结构,并举办聚会。Mojo在2025年Stack Overflow开发者调查中首次亮相,显示出快速采用。

Modular:Modverse #50:Modular平台25.5、社区聚会及Mojo在Stack Overflow开发者调查中的首次亮相

Modular Blog
Modular Blog · 2025-08-21T00:00:00Z
Modular:Modverse #49:Modular平台25.4,Modular 🤝 AMD,以及Modular Hack Weekend

上个月,Modular生态系统发布了25.4版本,与AMD建立了合作关系,支持AMD和NVIDIA硬件。新版本在BF16工作负载上提升了53%的吞吐量。全球开发者参与了Modular Hack Weekend,创造了量子模拟器和生物信息学库等项目。此外,推出了Mammoth系统,支持跨GPU的GenAI推理,Mojo内核可直接集成到Python工作流中。

Modular:Modverse #49:Modular平台25.4,Modular 🤝 AMD,以及Modular Hack Weekend

Modular Blog
Modular Blog · 2025-07-09T00:00:00Z
模块化:深入模块化黑客周末:顶尖项目与社区亮点

本周末,AI和系统编程社区的开发者参加了全球虚拟黑客马拉松,专注于Mojo和MAX的GPU编程。活动包括研讨会和项目开发,获奖项目有快速傅里叶变换、Mojo-Lapper和量子电路模拟器。感谢NVIDIA、Lambda和GPU MODE的支持。

模块化:深入模块化黑客周末:顶尖项目与社区亮点

Modular Blog
Modular Blog · 2025-07-03T00:00:00Z
Modular:Modular如何实现AI计算的民主化?(AI计算民主化,第11部分)

Modular旨在通过统一开发者、软件和硬件,解决AI软件生态的碎片化问题,推动AI技术的广泛应用。其平台包括Mojo编程语言、MAX服务框架和Mammoth集群管理,支持多种硬件,提升开发者体验。

Modular:Modular如何实现AI计算的民主化?(AI计算民主化,第11部分)

Modular Blog
Modular Blog · 2025-06-20T00:00:00Z
模块化平台25.4:一个容器,支持AMD和NVIDIA GPU,无锁定

Modular Platform 25.4正式支持AMD GPU,提升AI模型性能,降低成本,增强灵活性。新增Mojo与Python绑定,简化开发流程,欢迎开发者贡献,共同推动AI基础设施发展。

模块化平台25.4:一个容器,支持AMD和NVIDIA GPU,无锁定

Modular Blog
Modular Blog · 2025-06-18T00:00:00Z
Modular:Modverse #48:Modular Platform 25.3、MAX AI内核与Modular GPU内核黑客马拉松

五月发布了Modular Platform 25.3,包含超过45万行代码。举办了社区聚会和GPU内核黑客马拉松,吸引了100多名工程师和研究人员,分享了Mojo和MAX的最新进展。Mojo现已支持直接从Python调用,性能得到提升。社区的开源贡献持续增加。

Modular:Modverse #48:Modular Platform 25.3、MAX AI内核与Modular GPU内核黑客马拉松

Modular Blog
Modular Blog · 2025-05-29T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码