Mayx的博客 ·

近期LLM的部署与应用经历(3)

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

作者探讨了AI模型的进展，分享了使用RTX4090显卡和vLLM框架的体验。通过DeepSeek的新模型，长上下文处理能力显著提升，理解和生成内容的能力增强。尽管硬件更新迅速，AI软件优化同样至关重要，展现出无限潜力。

🎯

关键要点

作者使用RTX4090显卡和vLLM框架进行AI模型的探索。
DeepSeek的新模型显著提升了长上下文处理能力。
AI软件优化在硬件更新迅速的情况下同样重要。
作者尝试在两张RTX4090上运行GPT-OSS模型，发现性能提升明显。
使用vLLM框架比Ollama更高效，支持多卡并行。
DeepSeek支持1M长上下文，能够更好地理解和生成内容。
作者通过DeepSeek生成简历和分析文章，效果显著。
新模型在8GiB内存的MacBook上运行良好，表现优于早期模型。
LFM2.5-1.2B-Thinking模型在小参数下表现出色，展示了算法进步。
AI软件的发展潜力巨大，有限硬件环境下也能期待无限智能。

🏷️

继续阅读

Python源代码中的LLM使用
社交媒体上流传一种技巧，屏蔽GitHub上的claude用户后，访问其参与的项目会收到提示。这表明CPython等项目允许开发者使用编码助手。尽管目前仅有...
一款传奇天气应用的回归
尽管我简化了主屏幕，但仍然浪费时间在应用上，尤其是玩一款不喜欢的游戏《掉落猫》，对此我感到无奈。
当多模态开始卷落地：MiniCPM-o-4.5仅9B覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化
OpenBMB推出的MiniCPM-o-4.5模型仅用9B参数实现全模态能力，强调跨模态对齐与推理效率，适合主流GPU部署，具备高性能与轻量化优势。
年度征文｜LLM 眼中的好文章：少数派 2025 热门内容解码
文章探讨了高互动文章的特征，强调细节、真实脆弱感和可行动性的重要性。具体信息增强信任，脆弱感促进共鸣，实用内容提高互动率。作者认为，真实的人类经验在AI生...
聊天机器人市场受益于 CRM 集成、云部署和对话式 AI 的进步而蓬勃发展
聊天机器人市场正在快速增长，从简单的自动回复系统发展为智能AI对话代理，广泛应用于各行业以提升客户体验和降低成本。预计2024年至2031年将以5.7%的...
Sakana AI推出Doc-to-LoRa和Text-to-LoRa：能够即时理解长上下文并通过零样本自然语言调整LLM的超网络
Sakana AI 提出了两种方法：Text-to-LoRA (T2L) 和 Doc-to-LoRA (D2L)，通过轻量级超网络实现大型语言模型的高效定...

近期LLM的部署与应用经历(3)

内容提要

关键要点

标签

继续阅读