小红花·文摘

本研究提出了ShadowKV系统，旨在解决长上下文大语言模型推理中的低吞吐量问题。该系统通过存储低秩键缓存并卸载值缓存，显著提升了吞吐量，支持高达6倍的批量尺寸，在A100 GPU上吞吐量提升达到3.04倍。

ShadowKV：高吞吐量长上下文LLM推理中的KV缓存

BriefGPT - AI 论文速递 ·

GS-LRM是一个可扩展的大型重建模型，能够在单个A100 GPU上从2-4个稀疏图像中预测高质量的3D高斯原语，并在0.23秒内完成。该模型采用了基于transformer的简单架构，能够处理不同尺度和复杂性的场景。在Objaverse和RealEstate10K上进行训练后，该模型在对象和场景捕捉方面表现更好。

MVGamba：将 3D 内容生成统一为状态空间序列建模

BriefGPT - AI 论文速递 ·

作者使用A100 GPU资源进行了一次关于使用A100训练Vicuna-13b模型的实践。他进行了环境配置，安装了CUDA和Docker环境，克隆了仓库并下载了模型。然后，他拉取了PyTorch镜像并运行了容器，安装了相关依赖并进行了训练。最后，他解决了一些小问题。

使用A100GPU训练Vicuna-13b模型的实践

Chancel's blog ·

从环境配置到训练技巧：A100 GPU训练Vicuna-13b模型的完整指南

使用A100GPU训练Vicuna-13b模型的实践

Chancel's blog ·