小红花·文摘

Tensor Dancer 项目的开发环境配置

挖坑不填兽 ·

GGML是由Georgi Gerganov开发的高性能张量库，支持16位浮点数和整数量化，具有自动微分功能和内置优化算法。GGML针对苹果芯片进行了优化，并在x86架构上利用AVX/AVX2内置函数提升性能。它可以通过WebAssembly在Web环境中运行，无第三方依赖，无内存分配。GGMLSharp是对GGML的C#包装。

GGMLSharp及两个Demo。1：magika；2：mnist_cnn

dotNET跨平台 ·

LLM 推理和应用开源框架梳理 - JadePeng

博客园 - JadePeng ·

crabml是一个使用Rust重写GGML的实验性项目，已经支持推理Q8_0量化的Llama 3B模型，性能与ggml相差仅1token/s。crabml的设计目标是专注于推理，具有足够快速的推理能力，并采用mmap()和SIMD实现。同时，Yoshua Wuyts为WASI 0.2设计了一个异步运行时的实现。

【Rust日报】2024-02-29 - crabml，使用 Rust 重写 GGML

Rust.cc ·

本文介绍了使用ggml进行MNIST手写体识别模型的量化推理教程。首先用PyTorch训练一个简单的全连接神经网络，然后使用ggml进行模型量化，最后使用ggml进行模型推理。教程详细介绍了模型结构、量化过程、推理过程，并提供了代码示例。量化后模型大小显著减小。教程还包括了如何读取图片和运行推理的说明。

本文介绍了使用GGML机器学习张量库构建在CPU上运行LLaMA2大模型的方法。作者首先介绍了GGML是llama.cpp和whisper.cpp项目的关键支撑技术，是一个高性能计算库。然后，作者详细介绍了将LLaMA2中文模型转换为GGML格式并进行量化操作的步骤。接着，作者提供了使用GGML/LLaMA.CPP镜像运行LLaMA2模型的方法，并展示了与助手Bob的对话示例。最后，作者强调了构建镜像和模型的优化空间，并鼓励读者继续探索和使用LLaMA2模型。

构建能够使用 CPU 运行的 MetaAI LLaMA2 中文大模型

苏洋博客 ·

GGML PCA

Tensor Dancer 项目的开发环境配置

GGMLSharp及两个Demo。1：magika；2：mnist_cnn

GGML GGUF 文件格式漏洞

LLM 推理和应用开源框架梳理 - JadePeng

【Rust日报】2024-02-29 - crabml，使用 Rust 重写 GGML

ggml教程|mnist手写体识别量化推理

ggml教程|mnist手写体识别量化推理

ggml教程|mnist手写体识别量化推理

构建能够使用 CPU 运行的 MetaAI LLaMA2 中文大模型

GGML PCA

Tensor Dancer 项目的开发环境配置

GGMLSharp及两个Demo。1：magika；2：mnist_cnn

GGML GGUF 文件格式漏洞

LLM 推理和应用 开源框架梳理 - JadePeng

【Rust日报】2024-02-29 - crabml，使用 Rust 重写 GGML

ggml教程|mnist手写体识别量化推理

ggml教程|mnist手写体识别量化推理

ggml教程|mnist手写体识别量化推理

构建能够使用 CPU 运行的 MetaAI LLaMA2 中文大模型

LLM 推理和应用开源框架梳理 - JadePeng