小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

在将PyTorch模型转换为图时,控制流可能导致图断裂。使用符号整数(SymInts)可以表示动态形状,允许模型根据输入动态调整。代理张量和直接使用输入张量两种方法各有优缺点,代理张量语法更规范,但可能效率较低。

PyTorch图符号整数

Lei Mao's Log Book
Lei Mao's Log Book · 2026-04-05T07:00:00Z
移远通信推出一站式AI开发工具链AIDE

移远通信在2026年世界移动通信大会推出AI开发工具链AIDE,旨在解决AI算法落地的难题。AIDE支持多种模型格式和主流芯片,实现模型转换、优化与推理,提升AI应用效率,并兼容多操作系统。

移远通信推出一站式AI开发工具链AIDE

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-05T08:50:42Z
Pytorch转ONNX报错-Cannot insert a Tensor that requires grad as a constant

在将Pytorch模型转换为ONNX时,遇到“无法将需要梯度的Tensor作为常量”的错误。问题出在Conv2D层的权重设置为requires_grad为True。最终解决方案是将模型所有层的参数设置为requires_grad = False。

Pytorch转ONNX报错-Cannot insert a Tensor that requires grad as a constant

Yunfeng's Simple Blog
Yunfeng's Simple Blog · 2025-07-09T11:16:09Z
Gemini-cli

Gemini-cli是一个支持Gemini-2.5-pro模型的免费开源命令行工具,类似于Claude-code。它能快速生成项目,帮助用户高效使用API,节省时间。作者在三小时内完成了一个模型转换项目,展示了其强大功能和谷歌在AI领域的决心。

Gemini-cli

informal
informal · 2025-07-06T16:00:00Z

使用TensorRT部署YOLO模型的流程包括模型转换(PyTorch→ONNX→TensorRT)、集成TensorRT-YOLO工具和性能优化。最佳实践建议采用FP16量化、动态批处理和内存管理,以提高推理速度和精度。提供了Python和C++代码示例,帮助用户理解操作。

【推理加速】TensorRT C++ 部署YOLO11全系模型

gloomyfish
gloomyfish · 2025-05-22T12:45:02Z
Codable宏让Swift序列化变得如此简单!

ReerCodable是一个基于Swift宏的框架,旨在简化Codable的使用,减少样板代码。通过声明性注解,开发者可以轻松实现JSON与模型的转换,支持自定义键、嵌套结构和命名风格转换,从而提高代码的可读性和维护性。

Codable宏让Swift序列化变得如此简单!

DEV Community
DEV Community · 2025-05-08T12:05:40Z

本研究提出RADLADS协议,快速将softmax注意力变换器转换为线性注意力解码器,解决传统模型效率不足的问题。该方法使用350-700M个token,保持推理质量,实现显著的成本效益,并在标准基准测试中表现优异。

RADLADS:针对大规模线性注意力解码器的快速注意力蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z
华为HarmonyOS Next智能家居控制系统中模型转换与数据处理的实际应用

本文探讨了华为HarmonyOS Next智能家居控制系统中模型转换与数据处理的应用。系统需实时监控设备状态,做出智能控制决策,并提供数据可视化。通过选择合适的深度学习框架和设计数据架构,确保数据的稳定收集与传输,从而提升系统性能,实现高效的智能家居管理。

华为HarmonyOS Next智能家居控制系统中模型转换与数据处理的实际应用

DEV Community
DEV Community · 2025-02-20T06:01:18Z
HarmonyOS Next深度学习模型转换指南

本文探讨了华为HarmonyOS Next系统中深度学习模型转换的技术细节,强调模型格式和规范的重要性。支持TensorFlow和PyTorch等主流框架,并提供转换工具。详细介绍了模型转换步骤、参数配置及常见问题解决方案,同时提出了剪枝和量化等模型验证与优化方法,以提升模型在HarmonyOS Next设备上的性能。

HarmonyOS Next深度学习模型转换指南

DEV Community
DEV Community · 2025-02-19T07:47:39Z

ONNX-MLIR 是一个用于优化和编译 ONNX 模型的工具,能够将模型转换为高效的可执行文件,支持多种硬件环境。本文介绍了如何使用 ONNX-MLIR 将鸢尾花分类模型转换为共享库并进行推理,包括模型构建、转换和 C++ 编程等步骤。

使用 ONNX-MLIR 優化 ONNX 模型並在 C++ 中進行推論

1010Code
1010Code · 2024-11-15T16:00:00Z
如何使用TensorRT优化和部署ONNX模型

本文介绍了如何使用NVIDIA的TensorRT将ONNX模型转换为TensorRT引擎文件,以优化深度学习模型性能。通过trtexec工具,可以将模型转换为FP32、FP16和INT8精度,从而提升推理速度和内存效率。文章还讨论了转换过程中的设置、选项及测试转换后引擎文件性能的方法。

如何使用TensorRT优化和部署ONNX模型

DEV Community
DEV Community · 2024-11-15T14:24:52Z

本研究提出了一种解决大型语言模型微调中对人类注释数据或GPT-4生成数据的依赖问题的方法。通过将网络爬取数据与高质量数据对齐,自动创建配对训练数据集,提高微调质量。实验结果表明,经过模型转换的数据训练效果优于仅使用高质量数据,平均提升9.4%。7B模型在表现上超过了多个32B以上的开源模型及知名的闭源模型如GPT-3.5。

利用网络爬取数据进行高质量微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

TensorRT-LLM是一个简化模型转换为TensorRT格式的工具,支持特定的GPU模型,旨在更轻松地在TensorRT上运行大型模型。文章提供了配置编译环境和生成TensorRT格式模型的说明。它还解释了如何使用Rouge指标测试推理和评估模型的性能。文章还介绍了Triton Server,一个可扩展的推理框架,支持多个后端,包括TensorRT-LLM。它解释了如何使用Triton Server与TensorRT-LLM进行配置和使用,包括模型加载和版本控制。最后,它演示了如何启动推理服务,进行客户端调用,并使用Grafana监控性能指标。

容器下在 Triton Server 中使用 TensorRT-LLM 进行推理

陈少文的博客
陈少文的博客 · 2024-02-03T08:05:48Z

TensorRT-LLM是一个用于将模型转换为TensorRT格式的工具,支持多种显卡。使用TensorRT-LLM编译模型后,模型的RougeLsum指标有所下降,但推理速度有较大提升。Triton Server是一个支持多种后端的推理框架,包括TensorRT-LLM,可以进行批量推理和流水线并行推理。可以通过Triton Server的GRPC接口进行推理测试,并通过监控指标评估推理质量。

容器下使用 Triton Server 和 TensorRT-LLM 进行大模型推理

陈少文的博客
陈少文的博客 · 2024-02-03T08:05:48Z

GoFaceRec是一个使用Go构建的人脸识别工具,使用MTCNN进行人脸检测和QMagFace进行人脸识别。项目在Ubuntu 20.04上使用Go 1.17进行测试,将QMagFace模型从PyTorch转换为TensorFlow,并使用tfgo进行模型运行。主要挑战是不同类型之间的转换,但在Python中这些转换更简单快速。

GoFaceRec:基于 Go 的深度学习人脸识别工具

极道
极道 · 2023-07-01T23:37:00Z

防腐层是一种隔离不同子系统间通信的策略,包括模型转换、门面封装、适配、降级处理、缓存等职能。适用于老系统迁移至新系统、两个子系统间存在不同语义但需要通信的场景。

系统认知篇:防腐层、门面模式及适配模式的本质 | 京东云技术团队

京东科技开发者
京东科技开发者 · 2023-04-26T02:03:50Z

昇腾CANN提供的模型转换工具ATC可以将开源框架的网络模型和单算子描述文件转换为昇腾AI处理器支持的模型文件,支持自定义输入输出数据类型、动态BatchSize/动态分辨率等特性。

ATC:一个能将主流开源框架模型转换为昇腾模型的神奇工具

华为云官方博客
华为云官方博客 · 2023-02-28T02:40:58Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码