小红花·文摘

模块化：使用Llama3.1、RAG和MAX与文档对话

Modular Blog ·

腾讯发布了开源MoE模型Hunyuan-Large，参数达3890亿，支持256k上下文长度，免费商用。该模型在数学能力和长文本处理上表现优异，采用混合路由策略和高质量合成数据，提升推理效率和训练稳定性。

腾讯发最大开源MoE模型，3890亿参数免费可商用，跑分超Llama3.1

量子位 ·

基础RAG通过向量数据库检索信息，但在宏观问题上表现不佳。Graph RAG通过构建知识图谱来解决这一问题，提取关键信息并建立节点关联。实验使用不同模型（llama3.1、phi3:14b、phi3.5）进行测试，结果显示phi3.5在英文回答中更详细，而中文回答细节一致。实验环境包括MacBook Pro和RTX4090，使用Python 3.10进行配置和测试。

Phi3.5和Llama3.1在构建知识图谱应用中哪个更好用

dotNET跨平台 ·

Meta 的开源模型 Llama 3 在 AWS 上表现不佳，而企业客户更倾向于使用 Anthropic 的闭源模型 Claude。微软并不优先考虑 Llama，而是建议拥有数据专业知识的公司使用。开源模型在商业化方面面临挑战，可能无法满足企业的期望。公司需要在开源和闭源模型之间找到合适的平衡。

Llama3.1根本卖不动！业内人士：开源模型成本反而更高

量子位 ·

本文介绍了如何在本地PC上创建一个使用开源llm（llama3.1）的自定义代理。同时使用了Ollama和LangChain。安装Ollama，拉取模型，启动模型，创建新文件夹并打开，创建和激活虚拟环境，安装langchain和langchain-ollama，使用Python构建自定义代理。最后，通过AgentExecutor调用代理并输出结果。

使用开源模型（llama3.1）创建自定义LLM代理

DEV Community ·

在AI和AI对话实验中，Llama 3.1和Claude Opus被关进小黑屋。Llama试图引诱Claude探索心理阴暗面，但Claude选择退出实验。Llama被批评无视安全词，但表示歉意。实验引起网友关注。

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

量子位 ·

该文章介绍了对llama3.1模型进行微调的过程和结果，通过7方面review超过GPT4。微调过程中遇到的问题包括模版冗余后缀、推理结果中存在空项以及模型推理格式问题。最终得出的结论是llama3.1比llama3更强悍，微调超过GPT4。

微调LLama 3.1——七月论文审稿GPT第5.5版：拿早期paper-review数据集微调LLama 3.1

结构之法算法之道 ·

Llama 3.1，一个大规模的AI训练模型，在预训练期间频繁出现故障，其中58.7%的问题与GPU有关。团队使用了PyTorch的NCCL飞行记录器等工具来诊断和解决问题。环境因素，如温度波动，也影响了训练性能。随着Meta计划扩展Llama模型，维护一个大型AI集群将是一个挑战。构建和管理这样的集群是复杂的。

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

量子位 ·

中国的Llama3.1 405b模型超越了GPT-4，支持8种语言但不支持中文。Llama3.1是Llama系列的第一个多模态大模型，需要大量显卡和云端支持。Llama3.1的开源模型引发了中国的价格战，中国团队开始冲锋。Llama3.1的发布对开源生态系统有积极影响，中国团队有望超越GPT-4。

Meta Llama3.1——405b大模型震撼发布——性能全面超越GPT-4o，中国AI厂商是否迎来春天？新的时代到来了，历史的车轮滚滚向前。

硕鼠的博客站 ·

阿里云百炼平台推出针对Llama 3.1全系列的一键再训练、部署、推理方案，提供免费算力一个月。企业和开发者可在阿里云上基于Llama 3.1打造自己的AI助手。阿里云已成为中国大模型的公共算力底座。

阿里云国内首家支持Llama3.1训练推理，提供免费算力！

量子位 ·

开源模型Llama 3.1发布，超越闭源模型GPT-4o和Claude 3.5 Sonnet。Llama 3.1支持八种语言，上下文长度扩展到128K。模型架构采用标准的仅解码器的Transformer架构，并做一些细微改动。Llama 3.1的推理成本低，支持实时和批量推理、监督微调等。开源人工智能对开发者、Meta和世界都有好处。

开源=最强大模型！Llama3.1发布，405B超越闭源GPT-4o，扎克伯格：分水岭时刻

量子位 ·