小红花·文摘

本文探讨了英伟达的视觉语言模型Eagle 2，强调数据策略在模型开发中的关键作用。作者详细介绍了数据收集、过滤和选择的方法，提出多样化数据可提升模型性能。Eagle 2在多模态基准测试中表现出色，展示了开源视觉语言模型的潜力与发展方向。

多模态LLaVA系列与Eagle 2——从组合CLIP ViT和Vicuna的LLaVA，到英伟达开源的VLM Eagle 2(用于人形VLA GR00T N1中)

结构之法算法之道 ·

本研究通过低秩适应技术微调Meta的LLaMA架构，提升了中文指令跟随能力。Chinese-Vicuna在翻译、代码生成和领域特定问答等任务中表现优异，为中文LLM应用奠定了多功能基础。

Chinese-Vicuna：一款基于Llama的中文指令跟随模型

BriefGPT - AI 论文速递 ·

该研究通过训练 UserGPT 模拟器，产生了高质量的合成对话数据集 RealChat，并在实验中表现出极高的竞争力。ReaLM 在 MT-Bench 中获得领先分数，展示了可扩展性和可迁移性。研究还探索了训练集数据质量与模型性能之间的相互作用。

大型语言模型之战: Dolly 对 LLaMA 对 Vicuna 对 Guanaco 对 Bard 对 ChatGPT -- 文本到 SQL 解析比较

BriefGPT - AI 论文速递 ·

作者使用A100 GPU资源进行了一次关于使用A100训练Vicuna-13b模型的实践。他进行了环境配置，安装了CUDA和Docker环境，克隆了仓库并下载了模型。然后，他拉取了PyTorch镜像并运行了容器，安装了相关依赖并进行了训练。最后，他解决了一些小问题。

使用A100GPU训练Vicuna-13b模型的实践

Chancel's blog ·

从环境配置到训练技巧：A100 GPU训练Vicuna-13b模型的完整指南

这是一个开源的聊天机器人，通过微调LLaMA对约70K用户共享的ChatGPT对话进行训练。它声称在质量上超过了OpenAI ChatGPT和Google Bard的90%，同时在90%以上的情况下优于LLaMA和斯坦福大学Alpaca等其他模型。它可以在单一的GPU上运行。这个聊天机器人类似于ChatGPT，可以解释问题。在数学解题方面，它能得到正确的最终答案，但需要仔细研究解释和痕迹，因为对于LLM来说这很困难。在生成数据方面，质量与ChatGPT非常相似。

Vicuna：一个GPT-4开源聊天机器人

解道jdon.com ·

1、Vicuna 是什么？一个基于 LLaMA 微调的大语言模型。Vicuna-13B 是一个使用 ShareGPT 收集的用户对话数据进行训练的开源 ChatBot。Vicuna 使用 GPT-4 进行评估，其在质量方面已经达到了超过 90% 的 OpenAI ChatGPT 和 Google Bard，同时在超过 90% 的情况下表现优于 LLaMA、Stanford Alpaca。...

上船跑模型之 MacBook 上运行 Vicuna（ShareGPT 微调版 LLaMA-13B）

麦克船长的技术、产品与商业博客 ·

还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节)该项目部分一开始是作为此文《》的第4部分，但但随着研究深入为避免该文篇幅又过长，将把『第4部分开源项目』抽取出来独立成本文。

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

结构之法算法之道 ·