小红花·文摘

GGML是由Georgi Gerganov开发的高性能张量库，支持16位浮点数和整数量化，具有自动微分功能和内置优化算法。GGML针对苹果芯片进行了优化，并在x86架构上利用AVX/AVX2内置函数提升性能。它可以通过WebAssembly在Web环境中运行，无第三方依赖，无内存分配。GGMLSharp是对GGML的C#包装。

GGMLSharp及两个Demo。1：magika；2：mnist_cnn

dotNET跨平台 ·

本文介绍了使用GGML机器学习张量库构建在CPU上运行LLaMA2大模型的方法。作者首先介绍了GGML是llama.cpp和whisper.cpp项目的关键支撑技术，是一个高性能计算库。然后，作者详细介绍了将LLaMA2中文模型转换为GGML格式并进行量化操作的步骤。接着，作者提供了使用GGML/LLaMA.CPP镜像运行LLaMA2模型的方法，并展示了与助手Bob的对话示例。最后，作者强调了构建镜像和模型的优化空间，并鼓励读者继续探索和使用LLaMA2模型。

构建能够使用 CPU 运行的 MetaAI LLaMA2 中文大模型

苏洋博客 ·