小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Meta 发布了唯一开源的 Llama 3.3 模型 Llama-3.3-70B-Instruct,其性能可与 405B 模型媲美。该系列的最后一款模型,期待 Llama 4 的推出。hyper.ai 提供一键部署及优质数据集和教程,支持 AI 研究与应用。

在线运行 Llama 3.3 唯一开源 70B 模型,性能堪比 405B!LaTeX OCR 数据集上线,助力数学公式识别

HyperAI超神经
HyperAI超神经 · 2024-12-31T08:41:29Z

Meta 发布了唯一开源模型 Llama 3.3 的 Llama-3.3-70B-Instruct,性能可与 405B 模型媲美。该系列的最后一款模型,未来将推出 Llama 4。hyper.ai 提供一键部署及优质数据集和教程,提升用户体验与研究。

在线运行 Llama 3.3 唯一开源 70B 模型,性能堪比 405B!LaTeX OCR 数据集上线,助力数学公式识别...

HyperAI超神经
HyperAI超神经 · 2024-12-30T03:00:53Z

Meta发布的Llama 3.3以70B参数实现405B性能,成本显著降低。谷歌的Gemini 1206更新后重回榜首,马斯克的Grok 3即将发布,市场竞争激烈。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

量子位
量子位 · 2024-12-07T04:36:14Z
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B,效果媲美H100

随着AI模型参数增加,算力需求也在增长。Felafax公司通过简化AI训练集群,将训练成本降低了30%。他们使用JAX在AMD GPU上微调LLaMA 3.1 405B模型,展示了JAX在非英伟达硬件上的优势。JAX支持多硬件并行,适应性强,迁移方便。Felafax利用JAX的设备网格功能进行参数分片,优化内存和计算效率,并通过LoRA技术减少可训练参数,实现高效微调。相关代码已开源,并提供详细教程。

微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B,效果媲美H100

机器之心
机器之心 · 2024-10-08T06:26:45Z

Qwen2.5在任务中超越了LIama3和GPT-4o-mini,在指令跟踪、文本生成、数据理解和输出生成方面有所改进。提供不同的参数规模。在数学、编程和一般任务中表现出色。代码和数学模型已发布。在多个领域取得显著进展。

Qwen2.5登全球开源王座!72B击败LIama3 405B,轻松胜过GPT-4o-mini

量子位
量子位 · 2024-09-19T05:58:17Z

本文研究了量化对大型语言模型的影响,发现4位量化模型在新兴能力上表现良好,而2位模型性能显著下降。通过块量化技术,实现了几乎无损的6位量化,提升了计算和内存效率。此外,提出了激活量化感知和序列长度感知等创新技术,显著提高了任务准确度,为大型语言模型的高效部署提供了新思路。

量化指令调优大语言模型的综合评估:实验分析至405B

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

Meta发布了备受期待的Llama-3.1系列模型,包括405B“超级杯”型号,成为首个能与最强大模型媲美的开源模型。Llama-3.1系列包括8B、70B和405B三个版本,具有128k的扩展上下文长度和支持八种语言。405B模型目前是最大的开源模型,在各种评估指标上超过了GPT-4。SiliconCloud在其平台上推出了Llama-3.1系列模型,使开发者更容易访问和使用这些先进模型。该平台还提供加速推理和实惠的价格。除了Llama-3.1,SiliconCloud还提供各种其他开源语言模型、图像生成模型和代码生成模型。开发者可以免费使用这些模型,消除了开发和大规模推广中的计算成本。SiliconCloud旨在为开发者提供更快、更便宜、更全面的模型API,以实现更流畅的用户体验。

比肩GPT4,没有显卡也能用Llama-3.1-405B

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-08-09T03:54:44Z

北航商汤南洋理工等团队联合推出了Llama 3.1 405B的压缩工具,能够以超低成本进行量化。该工具支持多种压缩算法、模型和推理后端,具有强大的扩展性和全方位的评估能力。研究团队已将使用方法放在GitHub主页上。

单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了

量子位
量子位 · 2024-08-02T08:42:46Z
Meta发布Llama 3.1 405B,迄今为止最大的开源模型

Meta发布了Llama 3.1 405B语言模型,拥有4050亿参数、15万亿令牌和16000个GPU。云服务提供商支持该模型,包括Databricks、Dell、Nvidia、IBM、Snowflake和Scale AI等。Llama 3.1 405B支持8种语言,提供网页搜索、数学推理和代码执行等工具。用户可以下载权重并在应用中使用。根据Scale AI的SEAL排行榜,Llama 3.1 405B在数学推理和编码方面排名靠前。这次发布是AI行业的战略举措,也是技术上的突破。

Meta发布Llama 3.1 405B,迄今为止最大的开源模型

InfoQ
InfoQ · 2024-07-31T19:49:00Z
贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM

Meta开源了最新的405B模型(Llama 3.1 405B)和SGLang Runtime v0.2,提高模型推理速度。SGLang在运行Llama 3.1 405B时表现优于vLLM和TensorRT-LLM,吞吐量达到TensorRT-LLM的2.1倍,vLLM的3.8倍。SGLang是一个用于大型语言模型和视觉语言模型的快速服务框架,完全开源,由纯Python编写。它在离线和在线场景下都能提供卓越的性能。

贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM

机器之心
机器之心 · 2024-07-27T15:08:43Z
宣布在 Amazon Bedrock 中推出来自 Meta 的 Llama 3.1 405B、70B 和 8B 模型

Meta在Amazon Bedrock上线Llama 3.1模型,支持128K上下文长度,容量是Llama 3模型的16倍。Llama 3.1在行业基准测试中表现出色,提供多语言对话用例推理效率。

宣布在 Amazon Bedrock 中推出来自 Meta 的 Llama 3.1 405B、70B 和 8B 模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-07-24T14:22:23Z
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

Meta发布了Llama 3.1,这是世界上最大且最强大的开源语言模型。新版本支持八种语言,并将上下文长度扩展到128K。Llama 3.1与闭源模型相媲美,提供了各种组件来创建全面的系统。Meta还计划开发具有集成语音和视觉功能的模型。模型可以从Meta网站和Hugging Face下载。评估结果显示,Llama 3.1在各种任务中与领先的模型竞争力相当。Llama 3.1的架构经过优化,可进行大规模训练,使用了超过150万亿个标记。该模型还支持指令和基于聊天的微调。Meta发布了完整的参考系统和标准化接口,以促进与行业和开源社区的合作。开发人员可以根据自己的需求和应用定制模型。

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

机器之心
机器之心 · 2024-07-24T06:16:00Z
Llama 3.1发布:开源AI是未来吗?

Llama 3.1发布了三款机型,其中405B是开源机型首次与最好的封闭机型相媲美。Llama 3.1-405B在与GPT-4o进行的测试中表现不俗,但在日常任务中落后于gpt4。Llama 3.1-70B也相当不错。开源AI对开发人员有利,可以训练、微调和提炼自己的模型,掌控自己的命运,保护数据,并且具有高效且低成本的模型。开源AI的作用不会超过5%。开源AI模型虽然无法阅读和修改,但仍具有开放源代码的特点。

Llama 3.1发布:开源AI是未来吗?

极道
极道 · 2024-07-24T01:12:00Z

开源模型Llama 3.1发布,超越闭源模型GPT-4o和Claude 3.5 Sonnet。Llama 3.1支持八种语言,上下文长度扩展到128K。模型架构采用标准的仅解码器的Transformer架构,并做一些细微改动。Llama 3.1的推理成本低,支持实时和批量推理、监督微调等。开源人工智能对开发者、Meta和世界都有好处。

开源=最强大模型!Llama3.1发布,405B超越闭源GPT-4o,扎克伯格:分水岭时刻

量子位
量子位 · 2024-07-23T23:56:16Z
赶超 GPT-4o,最强大模型 Llama 3.1 405B 一夜封神,扎克伯格:开源引领新时代

Meta发布了Llama 3.1模型,这是他们迄今为止最强大的开源模型。Llama 3.1有三种尺寸,性能比GPT-4等其他模型更好。它支持多种语言,具有出色的代码生成性能,可以处理复杂的推理任务。该模型可免费下载并可在任何地方部署。Llama 3.1 405B版本在基准测试中表现优异。该模型使用了超过150万亿个标记进行训练,并针对可扩展性和简洁性进行了优化。它还利用合成数据生成来提高训练质量。Meta旨在引领开源人工智能时代,并相信Llama的未来将是行业中最先进的。

赶超 GPT-4o,最强大模型 Llama 3.1 405B 一夜封神,扎克伯格:开源引领新时代

爱范儿
爱范儿 · 2024-07-23T20:45:17Z
上周AI动态 #280 - GPT-4o mini、Llama 3.1 405B、SmoLLM、YouTube训练数据等!

OpenAI推出了GPT-4o mini,一款更小、更快、更具成本效益的人工智能模型,表现优异且运行成本便宜60%以上。Meta发布了Llama 3.1,最大的开源AI模型,使用了16000多个Nvidia H100 GPU进行开发,经过了严格测试。

上周AI动态 #280 - GPT-4o mini、Llama 3.1 405B、SmoLLM、YouTube训练数据等!

Last Week in AI
Last Week in AI · 2024-07-23T16:23:11Z
Meta发布新款Llama 3.1模型,包括备受期待的405B参数版本

Meta发布了Llama 3.1系列的多语言大型语言模型(LLM)。Llama 3.1-405B模型是最大的开源语言模型,拥有405B个参数,可在IBM Watsonx上部署。该版本包括更长的上下文长度、扩展的工具使用和多语言能力。与领先模型相比,Llama 3.1模型取得了令人印象深刻的性能基准。发布还包括安全措施和防护措施。Llama 3.1模型可用于合成数据生成、知识蒸馏、其他模型的评估和微调。模型具有更长的上下文窗口、改进的安全措施,并且支持多语言。IBM Watsonx提供了定制和实施Llama 3.1模型的平台。

Meta发布新款Llama 3.1模型,包括备受期待的405B参数版本

IBM Blog
IBM Blog · 2024-07-23T15:15:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码