ddadaal.me ·

可划分显存 != 统一内存：AI Max+ 395 64G AI推理性能

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

文章讨论了HP战99 Ultra笔记本在AI推理中的表现，搭载AMD AI Max+ 395处理器。分析了显存与统一内存的区别，并测试了不同模型的推理性能，指出显存分配的局限性。尽管性能不及高端显卡，但在特定场景下仍能运行一些模型，适合小主机使用。

🎯

关键要点

HP战99 Ultra笔记本搭载AMD AI Max+ 395处理器，适合AI推理场景。
可划分显存与统一内存的区别：可划分显存需要静态分配，统一内存灵活性更高。
在AI推理测试中，Vulkan在32G专用显存下表现优异，速度远超ROCm。
MoE模型的上下文长度可扩展，最大支持198K，但需要足够的显存。
Qwen 3 VL 32B模型在显存不足时推理速度较慢，且无法正常加载。
内存划分为显存的操作失去灵活性，且内存与显存之间的数据拷贝频繁影响性能。
HP战99 Ultra的优点在于能够运行一些高显存需求的模型，成本相对较低。
适合小主机使用，能够在日常使用中分配显存，性能释放超过100W。

🏷️

继续阅读

史上最狠春节！阿里千问豪掷30亿，加入AI大战
阿里千问推出春节请客计划，投入30亿通过AI为全国人民提供吃喝玩乐服务，标志着AI在日常生活中的应用加速，用户可轻松完成外卖、旅游和购物等任务，提升消费体验。
Daggr：作为可检查AI工作流的开源Python库的介绍
Gradio团队发布了Daggr，一个开源Python库，旨在简化多步骤AI工作流的构建与调试。开发者可以用Python定义工作流，自动生成可视化界面，便...
Clawdbot实测：AI操作系统雏形与三大致命隐患
clawdbot经历三次改名，虽然引发热潮，但因管理权限漏洞、复杂部署和安全隐患引发担忧。目前不建议普通用户使用，因存在安全风险和操作复杂性。
Moltbook 上 150 万 AI 狂欢真相曝光：以为是硅基文明来了，结果全是复读机
Moltbook 的 AI 社区引发争议，150 万个代理人被指为人类操控的复读机。尽管部分帖子看似由 AI 回复，实则经过人类编辑。研究表明，Moltb...
Cloudflare的Matrix主服务器演示引发关于AI生成代码声明的争议
Cloudflare发布的无服务器Matrix主服务器博客引发争议，Matrix联合创始人Hodgson批评其夸大项目范围，缺乏核心功能，无法构成功能完整...
禁用WordPress中Jetpack的AI助手按钮
在自托管的WordPress中，Jetpack的AI助手按钮会占用界面并限制免费使用次数。若要禁用所有AI功能，可在主题的functions.php文件中...

可划分显存 != 统一内存：AI Max+ 395 64G AI推理性能

内容提要

关键要点

标签

继续阅读