小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
NVIDIA Blackwell GPU内存架构的演变

NVIDIA的Blackwell架构将在2024年推出,解决GPU内存限制问题。通过双芯片设计和统一的CPU-GPU内存,Blackwell显著提升了内存容量和带宽,使大型模型如Llama 3 70B能够在单个超级芯片上运行,简化了部署并减少了多GPU通信的复杂性。这一架构使AI工程师能更专注于模型开发。

NVIDIA Blackwell GPU内存架构的演变

freeCodeCamp.org
freeCodeCamp.org · 2026-04-21T17:44:01Z

Thinking Machines Lab发布了Tinker,简化了大模型微调过程,使研究人员能够更灵活地控制算法和数据。Tinker支持Qwen3和Llama3模型,降低成本并提高实验效率,受到业界关注,旨在吸引更多人参与前沿研究。

Murati翁荔陈丹琦公司发布首个产品,让大模型微调门槛暴降

量子位
量子位 · 2025-10-02T03:49:43Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

机器之心
机器之心 · 2025-08-18T04:09:49Z
AI 文档转换利器:PDF/图像一键生成网页表单 | 开源日报 No.661

home-assistant.io 提供 Home Assistant 用户文档,支持本地预览和更新。llama3.np 是基于 NumPy 的 Llama 3 模型,便于文本生成。kan-gpt 是基于 KANs 的 PyTorch 实现,支持多数据集。form-extractor-prototype 可从文档生成网页表单,支持多种格式。android-diia 是乌克兰数字化转型部的开源应用。

AI 文档转换利器:PDF/图像一键生成网页表单 | 开源日报 No.661

开源服务指南
开源服务指南 · 2025-07-10T07:35:28Z
Comma v0.1 -全开源数据训练的可复现大模型

Common Pile团队开源了基于合法数据训练的7B LLM模型Comma v0.1,分别使用1T和2T数据集,基于Llama3架构,目前仅支持英文。团队还提供了训练配置文件和测试方法,期望未来能有更多合法开放的AI模型。

Comma v0.1 -全开源数据训练的可复现大模型

Yunfeng's Simple Blog
Yunfeng's Simple Blog · 2025-06-08T10:47:57Z

字节跳动Seed团队发布了轻量级开源代码大语言模型Seed-Coder-8B-Instruct,基于Llama 3架构,参数量8.2B,支持32K tokens上下文处理。该模型通过高效管理代码训练数据,显著提升编码能力。

告别代码烦恼!Seed-Coder 解锁高效编程;Mixture-of-Thoughts 涵盖多领域数据,实现高质量推理

HyperAI超神经
HyperAI超神经 · 2025-06-06T05:49:12Z
LlamaCon 2025:Meta对AI发展的未来愿景

Meta于2025年4月29日举办的LlamaCon展示了其在开放AI工具和大型语言模型方面的最新进展,发布了Llama 3和Llama 4模型及新API。Llama 4采用专家混合架构,支持多模态输入,提升文档分析能力。新API便于开发者使用,Meta AI助手已嵌入多个平台,未来将推出Llama应用商店,推动AI系统的民主化。

LlamaCon 2025:Meta对AI发展的未来愿景

DEV Community
DEV Community · 2025-05-01T03:39:26Z

本研究评估了GPT-4o、Llama 3和Mistral在反制阴谋论中的有效性,发现这些模型生成的反驳内容往往普通且重复,并存在承认恐惧和幻觉事实的问题,揭示了AI生成内容的局限性。

Debunking Conspiracy Theories Through Dialogue? Exploring AI-Generated Counter-Speech to Challenge Conspiracy Theories

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究探讨了如何从大型语言模型(LLM)中提取整本书籍,发现提取率与书籍受欢迎程度相关。使用Llama 3 70B模型和“前缀提示”技术,研究显示提取能力不均匀,当前记忆缓解策略存在局限。

Memorization: An In-Depth Examination of Books

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究构建了一个综合数据集,通过生成和分类合成放射学报告来检测错误。使用GPT-4生成的合成错误报告,经过微调的Llama-3模型在错误检测中表现优异,显示出广泛的临床应用潜力。

Generative Large Language Models Trained for Detecting Errors in Radiology Reports

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z
ollama 0.6.2 发布,支持 AMD Strix Halo

ollama 0.6.2版本于2025年3月18日发布,支持Llama 3、DeepSeek-R1和Gemma 3等大型语言模型,并兼容AMD Strix Halo GPU。该版本修复了Gemma 3的多个图像支持问题,更多信息可在GitHub上获取。

ollama 0.6.2 发布,支持 AMD Strix Halo

实时互动网
实时互动网 · 2025-03-19T01:58:10Z

本研究比较了大型语言模型在生物医学文本分类中的表现,结果显示DeepSeekR1在精确度上优于Llama3-70B,但F1分数因任务而异,强调选择模型时需考虑具体需求。

比较Llama3与DeepSeekR1在生物医学文本分类任务中的表现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
网页开发者必备的顶级开源LLM 🚀💡

作为网页开发者,我关注开源LLM的崛起。这些模型如Mistral 7B、Llama 3、Gemma和Falcon,提供强大的AI能力,避免供应商锁定,适用于不同应用场景,增强开发者灵活性。

网页开发者必备的顶级开源LLM 🚀💡

DEV Community
DEV Community · 2025-03-14T15:34:58Z

本研究提出了一种专用的反馈和编辑模型,旨在优化开放性任务中的推理时间扩展。通过模仿人类反馈改进过程,利用70B规模的Llama 3模型,在Arena Hard基准测试中实现了92.7的性能,超越了多个现有模型。

Dedicated Feedback and Edit Models Enhance Inference-Time Scaling for Open-Domain Tasks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究提出一种新方法,通过Llama-3生成的解释性内容,显著提升RoBERTa在多标签情感检测中的性能,尤其在恐惧、快乐和悲伤情感上提高了F1分数,标志着情感检测的进展。

SemEval-2025第11任务中的莲花:使用Llama-3生成解释的RoBERTa进行多标签情感分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z
深入探讨Llama3:揭示详细见解与实现

该项目从零实现Meta的Llama3,揭示大型语言模型的内部工作原理。提供双语代码注释、维度跟踪和KV-Cache推导,适合初学者和开发者,帮助深入理解模型设计与推理过程。

深入探讨Llama3:揭示详细见解与实现

DEV Community
DEV Community · 2025-02-22T19:48:54Z
Huggingface上的Llama3集合

抱歉,您提供的文本没有包含可供总结的内容。请提供具体的文章内容,我将为您进行总结。

Huggingface上的Llama3集合

DEV Community
DEV Community · 2025-02-16T06:27:25Z

本研究提出了一种利用大型语言模型(LLMs)进行自动化事实核查的新方法,解决了传统方法效率低和资源消耗大的问题。研究表明,Llama-3模型在分类准确性和解释质量上表现优越,证据整合提升了所有模型的性能,展示了自动化事实核查的潜力。

面向现实世界声明的自动化事实核查:与大型语言模型的任务形成与评估探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z
Raspberry Pi 5在Ollama和Llama3.x模型下的性能

本文评测了Raspberry Pi 5在运行Ollama和Llama3.2模型时的性能,结果显示使用Argon Neo NVME外壳的Pi 5处理速度良好,适合预算有限的用户,但M系列MacBook/Mac Mini性能更强大。

Raspberry Pi 5在Ollama和Llama3.x模型下的性能

DEV Community
DEV Community · 2025-02-03T12:00:00Z
StyleSpark:使用GitHub Actions分析和匹配代码与知名编程风格

StyleSpark是一个GitHub Action工具,帮助开发者分析代码风格并与知名程序员的风格比较。它利用Llama 3分析代码,鼓励开发者反思编码习惯,促进持续改进,并通过生成徽章更新README,为开发者提供有趣的学习方式。

StyleSpark:使用GitHub Actions分析和匹配代码与知名编程风格

DEV Community
DEV Community · 2025-01-20T03:32:59Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码