小红花·文摘

n8n 模板大合集：助您高效创建自动化应用 | 开源日报 No.771

开源服务指南 ·

该示例展示了如何使用多路线功能进行离线推理，需HuggingFace凭证访问Llama2，并使用LoRA适配器进行SQL查询。

构建类似于Llama-2和Llama-3的仅解码器变换器模型

MachineLearningMastery.com ·

在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练

亚马逊AWS官方博客 ·

本文研究了大型语言模型（LLMs）在软件开发自动化中的应用，着重评估Llama 2-70B模型在科学应用中的代码生成、文档撰写和单元测试能力。通过测试，我们发现该模型在简单任务中表现良好，但在复杂计算方面存在显著困难，亟需改进以更好地支持科学计算工作流程。

使用LLaMA2进行LLM基准测试：评估多种编程语言的代码开发性能

BriefGPT - AI 论文速递 ·

本地对话助手：保护隐私的开源 GPT 项目 | 开源日报 No.498

开源服务指南 ·

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

机器之心 ·

大语言模型Y-Mol在药物研发中展现出强大能力，解决了领域知识不足和数据获取难题，提升了药物-靶标及药物-药物相互作用的预测性能，为药物研发提供了新工具。

首个！四大高校联合推出药物研发大语言模型Y-Mol，性能全面领先LLaMA2

HyperAI超神经 ·

Meta Spirit LM 在新的多模态生成AI模型中整合语音与文本

InfoQ ·

这篇论文探讨了使用开源Llama 2模型检测线上语言滥用的方法，显示其在内容审核和毒性检测中的高效性。研究发现，模型规模的增加对性能提升有限，而不同提示策略能显著提高检测效果。未来需关注模型的安全性和多样化标签，以改善仇恨言论检测的准确性。

DetoxBench：大型语言模型多任务欺诈与滥用检测基准

BriefGPT - AI 论文速递 ·

本研究提出了首个针对立陶宛语的开放Llama2大语言模型（LLMs），并配套提供了问答数据集和流行LLM基准的翻译。研究表明，高质量的预训练数据集对模型在语言理解任务上的高效表现至关重要。

立陶宛语的开放Llama2模型

BriefGPT - AI 论文速递 ·

本研究探讨了双向语言模型（如BERT）在标记分类任务中的应用，并分析了更大的一维语言模型（如Llama-2）的潜力。实验结果表明，结合小型反向语言模型的表示能显著提升命名实体识别的性能，尤其在稀有领域和少量学习环境中效果显著。

Acquiring Bidirectionality via Large and Small Language Models

BriefGPT - AI 论文速递 ·

Apple Teaches Large Models to Be Lazy: Faster Generation of the First Token While Maintaining Accuracy

机器之心 ·

我们开发了 Llama 2 系列大型语言模型，包括 Llama 2-Chat，表现优于其他开源聊天模型。TinyLlama 和 Code Llama 也展现了卓越性能。通过增强泰米尔语数据集，我们解决了语言代表性不足的问题，并引入 Llama Guard 提升安全性。研究表明，Llama 2-Chat 在生成问题方面优于其他模型，推动了语言建模的创新与发展。

基于 Amazon Bedrock 和 Llama2 构建智能导购解决方案

亚马逊AWS官方博客 ·

该论文提出了一种结合检索增强生成技术和迁移学习的方法，以提升教科书问答中的推理能力。通过微调Llama-2模型并引入RAG，模型在多项选择题上的精度显著提高。此外，研究开发了智能QA助手ChaTA，并提出了基于RAG的聊天机器人框架，展示了其在信息检索和用户查询响应中的有效性。

ChatQA 2：在长篇文本和 RAG 能力中弥合专有 LLMs 的差距

BriefGPT - AI 论文速递 ·

研究人员通过将AI的“慢思考”结果蒸馏进“快思考”，使Llama2的表现提升了257%，超过了GPT4，同时降低了推理成本。他们使用了四种不同的系统2方法进行微调，发现这种模式使系统1模型的表现大幅提升，甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。

AI慢思考蒸馏进快思考，Llama2升至GPT4水平，不写过程也能做对题

量子位 ·

华为云社区分享了昇思MindSpore技术公开课，深度解析LLaMA2模型架构。LLaMA2是Meta AI公司发布的开放高效语言模型，具有优异性能。LLaMA2的训练数据增加了40%，上下文长度翻倍，并采用了分组查询注意力机制。核心算法包括RMS Normalization、Group Multi Query Attention和SwiGLU Activation Function。LLaMA2在知识能力上有优势，但在学科、语言、推理和理解能力上被其他模型超越。未来大模型的发展方向包括改变底层模型架构、优化预训练微调方法和采用混合专家模型等。

n8n 模板大合集：助您高效创建自动化应用 | 开源日报 No.771

【vLLM 学习】Multilora Inference

构建类似于Llama-2和Llama-3的仅解码器变换器模型

在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练

使用LLaMA2进行LLM基准测试：评估多种编程语言的代码开发性能

本地对话助手：保护隐私的开源 GPT 项目 | 开源日报 No.498

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

首个！四大高校联合推出药物研发大语言模型Y-Mol，性能全面领先LLaMA2

Meta Spirit LM 在新的多模态生成AI模型中整合语音与文本

DetoxBench：大型语言模型多任务欺诈与滥用检测基准

立陶宛语的开放Llama2模型

Acquiring Bidirectionality via Large and Small Language Models

Apple Teaches Large Models to Be Lazy: Faster Generation of the First Token While Maintaining Accuracy

Llama 3 模型群

基于 Amazon Bedrock 和 Llama2 构建智能导购解决方案

ChatQA 2：在长篇文本和 RAG 能力中弥合专有 LLMs 的差距

AI慢思考蒸馏进快思考，Llama2升至GPT4水平，不写过程也能做对题

一文为你深度解析LLaMA2模型架构

大型语言模型作为科学综合评估器

FFN：一个细粒度的中英金融领域平行语料库