小红花·文摘

Thinking Machines Lab发布了Tinker，简化了大模型微调过程，使研究人员能够更灵活地控制算法和数据。Tinker支持Qwen3和Llama3模型，降低成本并提高实验效率，受到业界关注，旨在吸引更多人参与前沿研究。

Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

量子位 ·

机器之心数据服务现已上线，提供高效稳定的数据获取，简化数据爬取流程。

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

机器之心 ·

Comma v0.1 -全开源数据训练的可复现大模型

Yunfeng's Simple Blog ·

本研究比较了大型语言模型在生物医学文本分类中的表现，结果显示DeepSeekR1在精确度上优于Llama3-70B，但F1分数因任务而异，强调选择模型时需考虑具体需求。

比较Llama3与DeepSeekR1在生物医学文本分类任务中的表现

BriefGPT - AI 论文速递 ·

深入探讨Llama3：揭示详细见解与实现

DEV Community ·

Huggingface上的Llama3集合

DEV Community ·

Raspberry Pi 5在Ollama和Llama3.x模型下的性能

DEV Community ·

将旧笔记本电脑转变为本地AI聊天机器人，使用LLAMA3和Open WebUI

DEV Community ·

本研究探讨如何在资源匮乏的巴勒斯坦法律领域有效应用大型语言模型（LLMs）。我们提出了基于Llama-3.2-1B-Instruct的微调模型，利用合成的法律文本数据集，提供可持续且成本效益高的法律指导。实验结果表明，该模型在多种查询中表现良好，推动了AI法律援助工具的发展。

ALKAFI-LLAMA3: Fine-Tuning LLMs for Precise Legal Understanding in Palestine

BriefGPT - AI 论文速递 ·

结合 HSDP 及模型并行加速 Llama3 训练

亚马逊AWS官方博客 ·

本研究提出了一种上下文并行的方法，解决了长上下文大语言模型推理的性能瓶颈。该方法在多达128个H100 GPU和16个节点上实现近线性扩展性，成功在77秒内对Llama3 405B模型进行1M上下文预填充，展现出高效的并行性能。

Context Parallelism for Scalable Million-Token Inference

BriefGPT - AI 论文速递 ·

本研究旨在解决自动医学报告生成（MRG）中存在的效率低下问题。通过采用多模态大型语言模型，结合3D视觉变换器（ViT3D）处理3D扫描，提出了一种新的自动化报告生成方法。实验结果显示，该模型在MRG任务验证集上取得了0.3的平均Green分数，并在视觉问答任务验证集上达到了0.61的准确率，超越了基线模型，验证了ViT3D对LLaMA3的有效对齐在MRG和VQA任务中的潜力。

ViT3D对LLaMA3的对齐：3D医学图像报告生成

BriefGPT - AI 论文速递 ·

本应用旨在构建高级数据模型并将其用于摄像头数据的摄入和各种搜索选项。学习数据摄入、数据查找和格式化，将数据存储到Milvus中，使用标量和多个向量字段进行数据模型优化，使用标量和多个向量查询存储在Milvus中的数据，并在笔记本中重新排序最终结果。通过本应用，您将全面了解使用Milvus、半结构化和非结构化数据的数据摄入对象以及使用开源模型构建强大高效的数据检索系统。

OLLAMA + LLAMA3 + RAG + 向量数据库（本地，开源，免费）

DEV Community ·

在 Amazon SageMaker 平台上使用 LlamaFactory 框架训练 Meta Llama3

亚马逊AWS官方博客 ·

Llama3训练每3小时崩一次？豆包大模型、港大团队为脆皮万卡训练提效

机器之心 ·

Meta Llama3 模型微调与推理解决方案 | 开源日报 No.321

开源服务指南 ·

OpenAI的Scaling Laws被视为大语言模型的摩尔定律。清华大学博士指出，为了提升模型性能，需要增加数据量至少10个数量级。华盛顿大学等机构提出了实验测试平台DCLM，通过固定训练代码，鼓励研究人员提出新的训练集来进行创新。DCLM-BASELINE是一个高质量训练集，通过基于模型的过滤达到了64%的准确性。DCLM提供了新的思考范式和可能性。

斯坦福/苹果等23所机构发布DCLM基准测试，高质量数据集能否撼动Scaling Laws？基础模型与Llama3 8B表现相当

HyperAI超神经 ·

上海交通大学生成式人工智能实验室（GAIR Lab）推出了评估大模型诚实性的基准BeHonest，从自我认知、非欺骗性和一致性三个核心维度出发，对9个主流大语言模型进行了评估。结果显示，大多数模型在回答已知问题时表现出色，但在主动承认未知方面存在不足。现有模型存在欺骗倾向，不论指令是否合理。较大模型表现更为稳定。BeHonest的研究为AI诚实性评估提供了依据，呼吁AI社区进一步关注诚实性问题。

Llama3比GPT-4o更爱说谎，首个大模型“诚实性”评估基准来了 | 上海交大

量子位 ·

学习llama3

Sekyoro的博客小屋 ·

模块化：MAX 24.4 的新功能有哪些？macOS 上的 MAX、快速本地 Llama3、原生量化和 GGUF 支持

Modular Blog ·