小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Thinking Machines Lab发布了Tinker,简化了大模型微调过程,使研究人员能够更灵活地控制算法和数据。Tinker支持Qwen3和Llama3模型,降低成本并提高实验效率,受到业界关注,旨在吸引更多人参与前沿研究。

Murati翁荔陈丹琦公司发布首个产品,让大模型微调门槛暴降

量子位
量子位 · 2025-10-02T03:49:43Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

机器之心
机器之心 · 2025-08-18T04:09:49Z
Comma v0.1 -全开源数据训练的可复现大模型

Common Pile团队开源了基于合法数据训练的7B LLM模型Comma v0.1,分别使用1T和2T数据集,基于Llama3架构,目前仅支持英文。团队还提供了训练配置文件和测试方法,期望未来能有更多合法开放的AI模型。

Comma v0.1 -全开源数据训练的可复现大模型

Yunfeng's Simple Blog
Yunfeng's Simple Blog · 2025-06-08T10:47:57Z

本研究比较了大型语言模型在生物医学文本分类中的表现,结果显示DeepSeekR1在精确度上优于Llama3-70B,但F1分数因任务而异,强调选择模型时需考虑具体需求。

比较Llama3与DeepSeekR1在生物医学文本分类任务中的表现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
深入探讨Llama3:揭示详细见解与实现

该项目从零实现Meta的Llama3,揭示大型语言模型的内部工作原理。提供双语代码注释、维度跟踪和KV-Cache推导,适合初学者和开发者,帮助深入理解模型设计与推理过程。

深入探讨Llama3:揭示详细见解与实现

DEV Community
DEV Community · 2025-02-22T19:48:54Z
Huggingface上的Llama3集合

抱歉,您提供的文本没有包含可供总结的内容。请提供具体的文章内容,我将为您进行总结。

Huggingface上的Llama3集合

DEV Community
DEV Community · 2025-02-16T06:27:25Z
Raspberry Pi 5在Ollama和Llama3.x模型下的性能

本文评测了Raspberry Pi 5在运行Ollama和Llama3.2模型时的性能,结果显示使用Argon Neo NVME外壳的Pi 5处理速度良好,适合预算有限的用户,但M系列MacBook/Mac Mini性能更强大。

Raspberry Pi 5在Ollama和Llama3.x模型下的性能

DEV Community
DEV Community · 2025-02-03T12:00:00Z
将旧笔记本电脑转变为本地AI聊天机器人,使用LLAMA3和Open WebUI

本文介绍了如何将旧笔记本电脑转变为本地ChatGPT克隆,使用Docker安装Open WebUI,并选择合适的语言模型(如llama3.2:1b),从而轻松搭建本地AI聊天机器人,保护隐私并支持定制与灵活使用。

将旧笔记本电脑转变为本地AI聊天机器人,使用LLAMA3和Open WebUI

DEV Community
DEV Community · 2024-12-22T20:21:54Z

本研究探讨如何在资源匮乏的巴勒斯坦法律领域有效应用大型语言模型(LLMs)。我们提出了基于Llama-3.2-1B-Instruct的微调模型,利用合成的法律文本数据集,提供可持续且成本效益高的法律指导。实验结果表明,该模型在多种查询中表现良好,推动了AI法律援助工具的发展。

ALKAFI-LLAMA3: Fine-Tuning LLMs for Precise Legal Understanding in Palestine

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z
结合 HSDP 及模型并行加速 Llama3 训练

Meta展示了FSDP(完全分片数据并行)如何利用AWS云基础设施提升大规模训练效率。FSDP通过消除冗余,在相同资源下训练更大模型。HSDP(混合分片数据并行)优化通信开销,提升训练性能。SMPv2结合FSDP和张量并行,简化训练配置,降低显存消耗,支持高效的大型模型训练。

结合 HSDP 及模型并行加速 Llama3 训练

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-12-02T03:09:26Z

本研究提出了一种上下文并行方法,解决了长上下文大语言模型推理的性能瓶颈,实现了在77秒内对Llama3 405B模型进行1M上下文预填充,展现了高并行效率和FLOPS利用率。

可扩展百万标记推理的上下文并行性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究旨在解决自动医学报告生成(MRG)中存在的效率低下问题。通过采用多模态大型语言模型,结合3D视觉变换器(ViT3D)处理3D扫描,提出了一种新的自动化报告生成方法。实验结果显示,该模型在MRG任务验证集上取得了0.3的平均Green分数,并在视觉问答任务验证集上达到了0.61的准确率,超越了基线模型,验证了ViT3D对LLaMA3的有效对齐在MRG和VQA任务中的潜力。

ViT3D对LLaMA3的对齐:3D医学图像报告生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-11T00:00:00Z
LWiAI 播客第183集 - OpenAI o1,Adobe视频生成,DeepMind AlphaProteo

OpenAI发布O1和O1 mini模型,具备高级推理能力和更长回复。Adobe在Firefly中加入视频生成功能。Anthropic推出专注AI安全的Claude企业版。LLAMA3 8B在合成标记上表现优异,AI生成创意更具新颖性。新AI预测机器人与资深预测者竞争。

LWiAI 播客第183集 - OpenAI o1,Adobe视频生成,DeepMind AlphaProteo

Last Week in AI
Last Week in AI · 2024-09-26T16:44:59Z

本应用旨在构建高级数据模型并将其用于摄像头数据的摄入和各种搜索选项。学习数据摄入、数据查找和格式化,将数据存储到Milvus中,使用标量和多个向量字段进行数据模型优化,使用标量和多个向量查询存储在Milvus中的数据,并在笔记本中重新排序最终结果。通过本应用,您将全面了解使用Milvus、半结构化和非结构化数据的数据摄入对象以及使用开源模型构建强大高效的数据检索系统。

OLLAMA + LLAMA3 + RAG + 向量数据库(本地,开源,免费)

DEV Community
DEV Community · 2024-08-31T19:12:35Z
在 Amazon SageMaker 平台上使用 LlamaFactory 框架训练 Meta Llama3

Amazon SageMaker是一项机器学习服务,帮助数据科学家和开发人员快速准备机器学习模型。LlamaFactory是一个支持多种微调技术的框架,用于统一高效微调大型语言模型。文章介绍了在Amazon SageMaker上使用LlamaFactory框架训练Llama3的过程,包括构建镜像、训练和部署模型。

在 Amazon SageMaker 平台上使用 LlamaFactory 框架训练 Meta Llama3

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-08-09T16:01:56Z
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

字节跳动豆包大模型团队与香港大学合作开发了名为ByteCheckpoint的大模型Checkpointing系统,支持多个训练框架,提升性能和易用性,实验结果表明存储和读取性能显著提升。团队计划扩展系统功能,支持更大规模的GPU集群训练任务和全生命周期的Checkpoint管理。

Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

机器之心
机器之心 · 2024-08-08T09:04:01Z

ali-vilab/VGen VGen 是一个基于扩散模型的全面视频生成生态系统。 VGen...

Meta Llama3 模型微调与推理解决方案 | 开源日报 No.321

开源服务指南
开源服务指南 · 2024-08-07T23:35:21Z

OpenAI的Scaling Laws被视为大语言模型的摩尔定律。清华大学博士指出,为了提升模型性能,需要增加数据量至少10个数量级。华盛顿大学等机构提出了实验测试平台DCLM,通过固定训练代码,鼓励研究人员提出新的训练集来进行创新。DCLM-BASELINE是一个高质量训练集,通过基于模型的过滤达到了64%的准确性。DCLM提供了新的思考范式和可能性。

斯坦福/苹果等23所机构发布DCLM基准测试,高质量数据集能否撼动Scaling Laws?基础模型与Llama3 8B表现相当

HyperAI超神经
HyperAI超神经 · 2024-07-18T05:09:51Z

上海交通大学生成式人工智能实验室(GAIR Lab)推出了评估大模型诚实性的基准BeHonest,从自我认知、非欺骗性和一致性三个核心维度出发,对9个主流大语言模型进行了评估。结果显示,大多数模型在回答已知问题时表现出色,但在主动承认未知方面存在不足。现有模型存在欺骗倾向,不论指令是否合理。较大模型表现更为稳定。BeHonest的研究为AI诚实性评估提供了依据,呼吁AI社区进一步关注诚实性问题。

Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大

量子位
量子位 · 2024-07-11T06:39:11Z

llama3是meta开源的大模型,在开源大模型中占着重要地位,在这之前可能是Mistral,目前也有gemma2,Qwen2以及微软的Phi3等.

学习llama3

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2024-07-08T06:44:29Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码