小红花·文摘 - 小红花技术领袖俱乐部

本地模型终于能打了：Gemma+LM Studio+Pi智能体实战笔记

本地模型终于能打了：Gemma+LM Studio+Pi智能体实战笔记

极道 ·

本文探讨了大模型训练中的开源框架，包括Megatron-LM、DeepSpeed和FSDP2。Megatron-LM专注于张量并行，适合超大模型；DeepSpeed通过ZeRO优化显存使用，易于集成；FSDP2提供简洁的API，支持与其他并行策略结合。文章分析了不同框架的优缺点及适用场景，帮助工程师选择合适的训练框架。

【大模型基础设施工程】07：Megatron-LM 与 DeepSpeed

土法炼钢兴趣小组的博客 ·

在Windows通过LM Studio使用Zotero MCP

在Windows通过LM Studio使用Zotero MCP

山月 ·

微软成功拦截AI生成的钓鱼攻击，NVIDIA修复高危漏洞，Linux内核曝出HID漏洞，思科修复零日漏洞，毒蛇组织运营恶意广告网络，LNK攻击绕过Windows安全，恶意Rust组件窃取加密货币密钥，PyPI维护者遭钓鱼攻击，GitLab修复DoS漏洞，朝鲜黑客针对加密货币开发者。

FreeBuf早报 | AI对抗AI：微软拦截LLM网络钓鱼攻击；NVIDIA修复Megatron-LM高危漏洞

FreeBuf网络安全行业门户 ·

NVIDIA发布安全更新，修复Megatron-LM中的四个高危漏洞，CVSS评分为7.8，可能导致代码执行和数据篡改。受影响版本为0.13.1及以下，建议用户立即更新。

NVIDIA修复Megatron-LM AI框架中的高危代码注入漏洞

FreeBuf网络安全行业门户 ·

LM Studio 0.3.17 增加了对工具集成的语言模型（LLMs）支持的模型上下文协议（MCP）

LM Studio 0.3.17 增加了对工具集成的语言模型（LLMs）支持的模型上下文协议（MCP）

InfoQ ·

TiC-LM：一个用于时间连续大型语言模型预训练的网络规模基准

TiC-LM：一个用于时间连续大型语言模型预训练的网络规模基准

Apple Machine Learning Research ·

NVIDIA 宣布其开源语言模型框架 Megatron-LM 存在两个高危漏洞（CVE-2025-23264 和 CVE-2025-23265），CVSS 评分为 7.8，可能导致远程代码执行和数据篡改。漏洞源于 Python 组件处理不当，影响 0.12.0 之前版本，已在 0.12.1 中修复。

NVIDIA Megatron-LM 存在双重注入风险：v0.12.1 版本修复代码执行漏洞

FreeBuf网络安全行业门户 ·

如何在本地安装Meta Perception LM 8B？

如何在本地安装Meta Perception LM 8B？

DEV Community ·

LM Studio通过NVIDIA GeForce RTX GPU和CUDA 12.8加速大型语言模型性能

LM Studio通过NVIDIA GeForce RTX GPU和CUDA 12.8加速大型语言模型性能

NVIDIA Blog ·

Ollama与LM Studio：本地运行大型语言模型的入门指南

Ollama与LM Studio：本地运行大型语言模型的入门指南

DEV Community ·

本研究解决了可解释药物发现领域的不足，提出了一种新的药物推荐方法KEDRec-LM，该模型通过知识蒸馏利用丰富的医学知识库生成药物推荐及其依据。研究结果表明，利用大型语言模型能够显著提升药物推荐的可解释性及有效性，在实际应用中具有重要影响。

KEDRec-LM：一个知识蒸馏可解释药物推荐的大型语言模型

BriefGPT - AI 论文速递 ·

深度求索公司推出的deepseek-v3和deepseek-r1大语言模型已达到顶级水平，且免费开源。尽管显卡资源需求较少，但训练成本高，普通用户难以部署全尺寸模型，通常只能使用小型蒸馏版本。LM Studio可在本地运行简化模型，适合学习和知识检索。

使用 LM Studio 在本地部署 Deepseek-R1 的蒸馏版大模型

Nicksxs's Blog ·

使用LM Studio和Pinggy在您的笔记本电脑上托管大型语言模型

使用LM Studio和Pinggy在您的笔记本电脑上托管大型语言模型

DEV Community ·

本研究提出B-cos LMs方法，旨在提高预训练语言模型的可解释性。通过将模型转化为B-cos网络并结合任务微调，B-cos LMs在生成更强解释的同时，保持了与传统微调相当的性能，展现出广泛的应用潜力。

B-cos LM: Efficient Transformation of Pre-trained Language Models for Enhanced Explainability

BriefGPT - AI 论文速递 ·

LM Studio是一个适合非技术用户的本地大模型工具，提供友好的图形界面和零配置操作，支持多平台。用户可以从Hugging Face等平台下载多种模型，确保隐私并支持离线运行。该工具还支持GPU加速，适合本地AI写作和问答服务。

轻松上手本地大模型，LM Studio带你飞

dotNET跨平台 ·

本研究提出了LP-LM系统，旨在解决大型语言模型在问答中产生虚构问题的现象。通过Prolog语义解析，确保回答的可靠性。实验结果表明，LP-LM在简单问题上始终提供准确答案，优于传统大型语言模型。

LP-LM: Eliminating Fabrication in Question-Answering Using Logic Programming

BriefGPT - AI 论文速递 ·

这是一个逐步的SEO友好指南，教你如何在本地系统中使用LM Studio中的DeepSeek-V2。

这是一个逐步的SEO友好指南，教你如何在本地系统中使用LM Studio中的DeepSeek-V2。

DEV Community ·

本研究针对当前神经符号推理在通用性、效率和推理能力方面的不足，引入了VERUS-LM框架。该框架通过通用提示机制和知识与查询的清晰分离，支持各种逻辑推理任务，实现了更好的适应性与计算效率，并在复杂推理任务中明显优于现有大型语言模型。此工作为更具多功能性的神经符号人工智能系统迈出了重要的一步。

VERUS-LM：一种结合大型语言模型与符号推理的多功能框架

BriefGPT - AI 论文速递 ·

Jina Reader-LM 将HTML转为Markdown的语言模型

Jina Reader-LM 将HTML转为Markdown的语言模型

编译程序 ·