小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
模块化:如何在没有GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

一位Mojo社区成员利用AI在Mojo中解决了量化挑战,其速度比C++/CUDA实现快1.07到1.84倍。Mojo简化了GPU编程,适合开发者使用。

模块化:如何在没有GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

Modular Blog
Modular Blog · 2026-01-14T00:00:00Z
Spring AI代理模式(第一部分):代理技能 - 模块化、可重用的能力

Spring AI的代理技能是模块化的指令和资源集合,支持灵活扩展AI代理能力。通过Java生态系统实现,确保与多种LLM模型兼容。技能以Markdown文件形式组织,便于动态加载、执行、管理和复用。将深入探讨任务管理和复杂多代理系统等主题。

Spring AI代理模式(第一部分):代理技能 - 模块化、可重用的能力

Spring
Spring · 2026-01-13T00:00:00Z
模块化:我如何在没有任何GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

我参加了一个量化挑战,使用Mojo编程,结果比C++/CUDA实现快1.07到1.84倍。Mojo简化了GPU编程,适合开发者尝试。

模块化:我如何在没有任何GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

Modular Blog
Modular Blog · 2026-01-12T00:00:00Z
Transformers v5引入了更模块化和互操作的核心

Hugging Face发布了Transformers v5的首个候选版本,强调互操作性和简化,采用模块化架构,主要支持PyTorch。新增的“transformers serve”组件便于模型部署,量化成为重要概念,旨在巩固Transformers作为开放AI开发的基础设施。

Transformers v5引入了更模块化和互操作的核心

InfoQ
InfoQ · 2025-12-16T16:45:00Z
模块化:通往Mojo 1.0的道路

Mojo语言自三年前起步,现已发展至1.0版本,旨在为开发者提供高性能的CPU和GPU编程。它结合了Python语法与现代系统编程能力,促进了开发者社区的成长。1.0版本将增强稳定性,未来将推出更多功能。

模块化:通往Mojo 1.0的道路

Modular Blog
Modular Blog · 2025-12-05T00:00:00Z
模块化:模块宇宙 #52:共同推进AI — 社区项目与平台里程碑

模块宇宙正在快速发展,社区不断创新,开发者们推出了Mojo的高性能计算库和量子模拟器。模块在AI和高性能计算领域表现优异,最近的基准测试显示其性能超过CUDA。模块团队还将举办活动,欢迎参与。

模块化:模块宇宙 #52:共同推进AI — 社区项目与平台里程碑

Modular Blog
Modular Blog · 2025-12-03T00:00:00Z
SkyRL - 一个模块化的全栈强化学习(RL)库,专为大语言模型设计

SkyRL是一个专注于大语言模型训练与评估的模块化强化学习库,提供环境构建、训练和部署功能,旨在实现可重复的研究与工程。其主要特点包括模块化组件、高性能训练管道和丰富的环境套件,适用于多轮对话任务和算法评估。

SkyRL - 一个模块化的全栈强化学习(RL)库,专为大语言模型设计

云原生
云原生 · 2025-11-30T12:03:09Z

模块化 Linux 通过将系统拆分为独立模块,解决了传统 Linux 的冗余和复杂性问题,支持按需构建、灵活扩展和易于维护,适用于物联网和边缘计算等场景。模块化设计提升了系统的稳定性和安全性,成为现代操作系统的核心范式。

模块化 Linux:构建灵活、高效的现代操作系统

极客技术博客’s Blog
极客技术博客’s Blog · 2025-11-17T10:00:10Z
模块化:2025年的PyTorch与LLVM——跟上AI创新的步伐

我参加了PyTorch大会和LLVM开发者会议,发现AI软件堆栈面临相似的基础设施挑战。开发者对语言和硬件的多样性感到困惑,渴望高效工具和统一平台。Mojo语言的出现为解决这些问题带来了希望,促进了开发者的学习与合作。

模块化:2025年的PyTorch与LLVM——跟上AI创新的步伐

Modular Blog
Modular Blog · 2025-11-06T00:00:00Z
Sound Blaster的模块化中心是一个可重新配置的音频控制面板

Creative公司推出Re:Imagine音频控制中心,具备模块化设计,支持USB-C、Wi-Fi 6和蓝牙,用户可自定义按钮,运行Linux系统,配备8核处理器和扩展存储,预计2026年交付,众筹价329美元。

Sound Blaster的模块化中心是一个可重新配置的音频控制面板

The Verge
The Verge · 2025-10-31T14:08:34Z
Spring Boot 模块化

Spring Boot 4 实现模块化,拆分了原有的自动配置 jar,提高了可维护性和清晰度。每种技术都有独立模块,简化了开发过程。迁移到 Spring Boot 4 需更新依赖和配置,经典启动器可助过渡,旨在提供更轻量、可组合的框架。

Spring Boot 模块化

Spring
Spring · 2025-10-28T00:00:00Z
从单体到模块化:通过可扩展的LoRA扩展语义路由

语义路由系统面临扩展挑战,多个模型独立运行导致计算成本线性增长。通过重构vLLM语义路由器的分类层,采用模块化架构、低秩适应(LoRA)和并发优化,解决了这一问题。新架构支持多模型,提升了多语言处理能力和长文档支持,显著提高了分类效率和并发性能。

从单体到模块化:通过可扩展的LoRA扩展语义路由

vLLM Blog
vLLM Blog · 2025-10-27T00:00:00Z

该项目已收录到C#/.NET/.NET Core优秀项目和框架精选中,关注优秀项目和框架精选能让你及时了解C#、.NET和.NET Core领域的最新动态和最佳实践,提高开发工作效率和质量。OrchardCore 是一个开源的(BSD-3-Clause license)、模块化的、支持多租户的应用程序框架,使用 ASP.NET Core...

一个基于 ASP.NET Core 的开源、模块化、多租户应用框架和内容管理系统

dotNET跨平台
dotNET跨平台 · 2025-10-06T07:16:40Z

系统采用分层架构设计,底层封装了运动控制接口与视觉算法库的调用逻辑,上层提供可视化操作界面与动态窗口管理功能。今天推荐一款开源视觉系统,通过模块化设计、开放接口与轻量化架构,为工业生产、自动化作业等领域提供一套高效、灵活的视觉识别与运动控制解决方案。该系统不仅支持多种算法库的无缝集成,还具备可视化交互界面与动态布局管理功能,可显著降低开发门槛,加速工业智能化转型。支持图像加载、实时显示与基础...

C# 开源视觉与运动控制集成平台,模块化设计赋能工业自动化

dotNET跨平台
dotNET跨平台 · 2025-09-23T23:57:37Z
模块化:模块化25.6:统一NVIDIA、AMD和Apple的最新GPU

Modular平台25.6发布,支持NVIDIA、AMD和Apple的GPU,提升AI计算性能,新增Mojo编程支持和优化的MAX性能,以满足不断增长的计算需求。

模块化:模块化25.6:统一NVIDIA、AMD和Apple的最新GPU

Modular Blog
Modular Blog · 2025-09-22T00:00:00Z
模块化:在Blackwell上的矩阵乘法:第4部分 - 打破SOTA

本文介绍了在NVIDIA Blackwell上优化矩阵乘法内核的过程,重点在于集群启动控制(CLC)优化。通过使用持久内核和调度器,消除了共享内存和障碍初始化的开销,性能提升15%,达到1772 TFLOPs,超越当前的SOTA。此外,探讨了通过块交换提高L2缓存命中率,从而实现更高效的调度和性能。

模块化:在Blackwell上的矩阵乘法:第4部分 - 打破SOTA

Modular Blog
Modular Blog · 2025-09-19T00:00:00Z
Tektronix发布MP5000系列模块化精密测试系统

Tektronix发布MP5000系列模块化精密测试系统,集成源测量单元和可编程电源,满足现代验证与生产的灵活性需求,支持多达32个大型机连接,适用于高吞吐量测试。未来将推出200伏高脉冲能力的SMU模块。

Tektronix发布MP5000系列模块化精密测试系统

全球TMT-美通国际
全球TMT-美通国际 · 2025-09-17T04:29:12Z
模块化:Blackwell上的矩阵乘法:第三部分 - 达到85%最先进性能的优化

本文探讨了在NVIDIA Blackwell GPU上通过2SM技术和流水线优化矩阵乘法性能,达到360.2 TFLOPs,接近85%的最先进水平。采用多播和2xSM MMA优化共享内存,减少数据冗余,并通过流水线技术提升计算与内存传输的重叠,最终实现1429 TFLOPs,达到81%的目标。

模块化:Blackwell上的矩阵乘法:第三部分 - 达到85%最先进性能的优化

Modular Blog
Modular Blog · 2025-09-12T00:00:00Z
模块化:Blackwell上的矩阵乘法:第二部分 - 利用硬件特性优化矩阵乘法

本文探讨了Nvidia Blackwell GPU架构下的矩阵乘法优化,采用共享内存和循环分块技术,性能提升超过50倍。通过利用Tensor Memory和新指令集tcgen05.mma,进一步提高计算效率。尽管取得显著进展,但仍未达到cuBLAS的性能水平,后续将继续优化。

模块化:Blackwell上的矩阵乘法:第二部分 - 利用硬件特性优化矩阵乘法

Modular Blog
Modular Blog · 2025-09-05T00:00:00Z
MCP:构建更智能、模块化AI代理的通用连接器

模型上下文协议(MCP)是一个开放标准,旨在连接AI代理与工具和数据。其关键组件包括用户界面主机、客户端和轻量级服务器。MCP通过标准化接口促进应用间互操作性,简化集成,推动工具开发的民主化。多个开源框架如LangChain和CrewAI已开始支持MCP,助力构建更强大的AI系统。

MCP:构建更智能、模块化AI代理的通用连接器

InfoQ
InfoQ · 2025-08-29T09:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码