Mayx的博客 ·

近期LLM的部署与应用经历(3)

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

作者探讨了AI模型的进展，分享了使用RTX4090显卡和vLLM框架的体验。通过DeepSeek的新模型，长上下文处理能力显著提升，理解和生成内容的能力增强。尽管硬件更新迅速，AI软件优化同样至关重要，展现出无限潜力。

🎯

❓

作者使用了RTX4090显卡进行AI模型的探索。

DeepSeek的新模型显著提升了长上下文处理能力，支持1M长上下文。

vLLM框架比Ollama更高效，支持多卡并行运行。

作者发现使用摘要会省略一些细节，因此直接上传完整内容效果更好。

LFM2.5-1.2B-Thinking模型参数较小，但表现出色，具备思维链能力。

作者认为AI软件的发展潜力巨大，有限硬件环境下也能期待无限智能。

🏷️

微软在Build大会发布七款MAI新模型：顶尖MAI-Thinking-1深度拆解
微软在Build大会上发布了七款新AI模型，特别是MAI-Thinking-1，展示了其完整的AI产业链。通过自研MAIA芯片和大量人类数据训练，微软实现...
早报｜苹果App Store四成头部应用已支持AI/千问上线肯德基skill/奈雪擦边LABUBU被判赔32万
腾讯客服表示，微信与华为、小米等厂商合作推出A2A助手，用户可通过AI助手发起微信通话或发送消息。荣耀部分机型已支持此功能，确保数据安全与隐私。
使用Scikit-LLM与开源语言模型
本文介绍如何使用Ollama本地托管的开源语言模型（如Llama 3、Mistral和Gemma）进行文本分类，避免支付API费用。内容包括Ollama的...
江波龙携全栈端侧AI存储应用参加COMPUTEX 2026
江波龙在COMPUTEX 2026展会上展示了全栈端侧AI存储新品，包括针对AI推理的AIDIMM和AILPBGA内存产品，解决了内存容量不足的问题。同时...
抵制基于网络的垃圾应用！微软鼓励开发者基于WinUI为Windows 11开发原生应用
微软将 WinUI 3 框架重命名为 WinUI，鼓励开发者为 Windows 11 开发原生应用，放弃基于 Web 技术的应用。微软承诺不再推出新 UI...
开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex
正如我们在 AWS 2026“What’s Next”大会上预告的那样，我们现在正式宣布：OpenAI GPT […]