ddadaal.me ·

可划分显存 != 统一内存：AI Max+ 395 64G AI推理性能

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

文章讨论了HP战99 Ultra笔记本在AI推理中的表现，搭载AMD AI Max+ 395处理器。分析了显存与统一内存的区别，并测试了不同模型的推理性能，指出显存分配的局限性。尽管性能不及高端显卡，但在特定场景下仍能运行一些模型，适合小主机使用。

🎯

🔎

可划分显存虽然可以将内存的一部分分配给GPU，但这种静态分配机制限制了灵活性。在实际使用中，用户需要根据不同模型的需求手动调整显存分配，这可能导致在某些情况下显存不足，影响推理性能。

测试结果显示，Vulkan在特定条件下的推理速度明显优于ROCm。这一差异可能与两者的架构和优化策略有关，用户在选择推理框架时应考虑这一点，以便获得更好的性能表现。

HP战99 Ultra虽然在性能上不及高端显卡，但其相对较低的成本和适合小主机的设计，使其在特定应用场景中仍具备竞争力。对于预算有限的用户来说，这款笔记本提供了一个可行的AI推理解决方案。

❓

HP战99 Ultra笔记本搭载AMD Ryzen AI Max+ 395处理器，内存为64G LPDDR5，显卡为Radeon 8060S，支持可划分显存。

可划分显存需要静态分配内存给GPU使用，而统一内存则允许CPU和GPU共享内存，无需显式分配，灵活性更高。

在测试中，Vulkan在32G专用显存下的推理速度显著优于ROCm，显示出更高的性能。

HP战99 Ultra适合小主机使用，能够运行一些高显存需求的模型，且成本相对较低。

在显存不足时，Qwen 3 VL 32B模型推理速度较慢，且无法正常加载。

显存划分操作失去灵活性，且每次切换显存需要重启，划分后的内存不能再作为系统内存使用。

🏷️