苏洋博客 ·

零一万物模型折腾笔记：官方 Yi-34B 模型基础使用

💡 原文中文，约24300字，阅读约需58分钟。

📝

内容提要

本文总结了作者对Yi-34B模型的实际应用和使用过程，以及生成转换INT8 GGUF模型的方法。接下来将讨论Yi-34B的性能和效果优化，以及开源模型的能力。

🎯

关键要点

本文讨论了Yi-34B模型的实际应用和使用过程。
Yi-34B在HuggingFace榜单中表现良好，多个变体模型排名靠前。
使用Yi-34B模型需要准备软件环境、模型程序文件和运行设备。
Docker环境可以简化模型运行的配置过程。
模型程序文件可以通过HuggingFace CLI下载。
运行Yi-34B模型的硬件要求不高，显卡需求可适度降低。
模型的基础使用展示了生成能力，但输出内容可能存在重复和不稳定。
通过调整模型参数可以改善生成内容的质量。
Yi-34B 200K模型适合处理超长文本，但运行时需注意显存限制。
GGUF格式是新的模型存储格式，支持快速加载和多种量化方式。
量化模型可以显著减少模型尺寸和提升运行速度。
制作GGUF量化模型的过程相对简单，需使用llama.cpp工具。
文章总结了Yi-34B的基础使用和常见问题，后续将讨论性能优化。

🏷️

继续阅读

派早报：Google 发布 Gemma 4 开源系列模型、智谱发布 GLM-5V-Turbo 多模态模型等
Google于4月2日发布了开源模型Gemma 4，强调参数效率和本地运行能力，支持多种设备和语言，具备多模态处理能力，适用于Agent工作流开发。该模型...
数据库性能策略及其隐含成本
数据库性能优化面临挑战，某项优化可能导致其他问题。例如，索引加速读取但减慢写入，缓存减少负载却可能引入过时数据。了解每种策略的成本及权衡至关重要。本文探讨...
全球权威大模型盲测榜单公布，阿里千问3.6登顶中国最强编程模型
阿里巴巴的Qwen 3.6-Plus在全球编程模型中排名第二，超越OpenAI和Google，成为中国最强编程模型。该模型在复杂Web开发中表现优异，推动...
谷歌开源发布Gemma 4系列模型体积更小但提供类似Kimi-K2.5的智能
谷歌推出Gemma 4系列模型，基于Gemini 3技术，体积小巧，适用于智能手机等边缘设备。该模型支持多模态输入，优化了参数效率和上下文长度，性能接近K...
公告：默认情况下，任何拥有链接的人都可以查看您的Granola笔记
Granola应用可能利用匿名数据来改进AI模型。企业客户默认不参与AI训练，其他用户可在设置中关闭此功能。公司禁止第三方使用用户数据进行AI训练。
Anthropic的艰难一周：泄露的模型、暴露的源代码以及失败的GitHub下架
Anthropic意识到其新模型Capybara可能带来的网络安全风险，因此向特定组织提供早期访问，以评估潜在风险并帮助网络防御者做好准备。

零一万物模型折腾笔记：官方 Yi-34B 模型基础使用

内容提要

关键要点

标签

继续阅读