小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了英伟达的视觉语言模型Eagle 2,强调数据策略在模型开发中的关键作用。作者详细介绍了数据收集、过滤和选择的方法,提出多样化数据可提升模型性能。Eagle 2在多模态基准测试中表现出色,展示了开源视觉语言模型的潜力与发展方向。

多模态LLaVA系列与Eagle 2——从组合CLIP ViT和Vicuna的LLaVA,到英伟达开源的VLM Eagle 2(用于人形VLA GR00T N1中)

结构之法 算法之道
结构之法 算法之道 · 2025-05-05T05:02:24Z

Chinese-Vicuna是一款基于LLaMA架构的中文指令跟随模型,采用低秩适应技术进行微调,旨在低资源环境中实现经济高效的部署。该模型在翻译、代码生成和领域特定问答等任务中表现优异,为中文大语言模型应用提供了多功能基础。

Chinese-Vicuna: A Chinese Instruction-Following Model Based on LLaMA

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出AISafetyLab框架及工具包,旨在解决AI安全评估标准化不足的问题。通过整合多种攻击、防御和评估方法,并对Vicuna进行实证研究,分析其策略的有效性,为AI安全研究提供参考。

AI Safety Lab: A Comprehensive Framework for AI Safety Assessment and Improvement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z
用于大型语言模型快速推测解码的递归草拟器

ReDrafter是一种先进的推测解码方法,通过递归神经网络、动态树注意力算法和知识蒸馏三大技术显著加速大型语言模型推理。在Nvidia H100 GPU上,Vicuna推理加速达3.5倍,TensorRT-LLM实现2.5倍加速,Apple Silicon设备应用也达2.3倍加速。

用于大型语言模型快速推测解码的递归草拟器

Apple Machine Learning Research
Apple Machine Learning Research · 2024-11-18T00:00:00Z

该研究通过训练 UserGPT 模拟器,产生了高质量的合成对话数据集 RealChat,并在实验中表现出极高的竞争力。ReaLM 在 MT-Bench 中获得领先分数,展示了可扩展性和可迁移性。研究还探索了训练集数据质量与模型性能之间的相互作用。

大型语言模型之战: Dolly 对 LLaMA 对 Vicuna 对 Guanaco 对 Bard 对 ChatGPT -- 文本到 SQL 解析比较

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z

作者使用A100 GPU资源进行了一次关于使用A100训练Vicuna-13b模型的实践。他进行了环境配置,安装了CUDA和Docker环境,克隆了仓库并下载了模型。然后,他拉取了PyTorch镜像并运行了容器,安装了相关依赖并进行了训练。最后,他解决了一些小问题。

使用A100GPU训练Vicuna-13b模型的实践

Chancel's blog
Chancel's blog · 2023-07-06T00:00:00Z

从环境配置到训练技巧:A100 GPU训练Vicuna-13b模型的完整指南

使用A100GPU训练Vicuna-13b模型的实践

Chancel's blog
Chancel's blog · 2023-07-06T00:00:00Z

这是一个开源的聊天机器人,通过微调LLaMA对约70K用户共享的ChatGPT对话进行训练。它声称在质量上超过了OpenAI ChatGPT和Google Bard的90%,同时在90%以上的情况下优于LLaMA和斯坦福大学Alpaca等其他模型。它可以在单一的GPU上运行。这个聊天机器人类似于ChatGPT,可以解释问题。在数学解题方面,它能得到正确的最终答案,但需要仔细研究解释和痕迹,因为对于LLM来说这很困难。在生成数据方面,质量与ChatGPT非常相似。

Vicuna:一个GPT-4开源聊天机器人

极道
极道 · 2023-04-04T01:05:00Z

本文总结了与ChatGPT相关的内容,包括生成式模型和开源社区的贡献。作者认为GPT现代化改进后的10B规模模型已足够应对大多数任务。同时提到了vicuna发布的模型和Koala模型在训练速度和性能方面的优势。最后,作者总结了开源社区的三个方向:ChatGPT效果复现、加速和应用。

ChatGPT 相关资料收集

Lucien's Blog
Lucien's Blog · 2023-04-02T15:01:00Z

1、Vicuna 是什么? 一个基于 LLaMA 微调的大语言模型。Vicuna-13B 是一个使用 ShareGPT 收集的用户对话数据进行训练的开源 ChatBot。Vicuna 使用 GPT-4 进行评估,其在质量方面已经达到了超过 90% 的 OpenAI ChatGPT 和 Google Bard,同时在超过 90% 的情况下表现优于 LLaMA、Stanford Alpaca。...

上船跑模型之 MacBook 上运行 Vicuna(ShareGPT 微调版 LLaMA-13B)

麦克船长的技术、产品与商业博客
麦克船长的技术、产品与商业博客 · 2023-04-01T00:40:13Z

还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节)​该项目部分一开始是作为此文《》的第4部分,但但随着研究深入 为避免该文篇幅又过长,将把『第4部分 开源项目』抽取出来 独立成本文。

LLaMA的解读与其微调:Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

结构之法 算法之道
结构之法 算法之道 · 2023-03-22T06:45:28Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码