小红花·文摘

该示例展示了如何使用多路线功能进行离线推理，需HuggingFace凭证访问Llama2，并使用LoRA适配器进行SQL查询。

【vLLM 学习】Multilora Inference

HyperAI超神经 ·

本文研究了大型语言模型（LLMs）在软件开发自动化中的应用，着重评估Llama 2-70B模型在科学应用中的代码生成、文档撰写和单元测试能力。通过测试，我们发现该模型在简单任务中表现良好，但在复杂计算方面存在显著困难，亟需改进以更好地支持科学计算工作流程。

使用LLaMA2进行LLM基准测试：评估多种编程语言的代码开发性能

BriefGPT - AI 论文速递 ·

本地对话助手：保护隐私的开源 GPT 项目 | 开源日报 No.498

开源服务指南 ·

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

机器之心 ·

大语言模型Y-Mol在药物研发中展现出强大能力，解决了领域知识不足和数据获取难题，提升了药物-靶标及药物-药物相互作用的预测性能，为药物研发提供了新工具。

首个！四大高校联合推出药物研发大语言模型Y-Mol，性能全面领先LLaMA2

HyperAI超神经 ·

本文介绍了一种基于开源语言模型LLAMA2的新方法，旨在从社交媒体和紧急信息中识别和分类紧急情况，以帮助公共安全通信员和用户。该模型能够理解911呼叫内容，提供指导并通知相关部门，尤其在911系统繁忙时，有效传递用户位置和紧急信息。

在危机场景中利用大语言模型进行机器翻译：低资源语言的蓝图

BriefGPT - AI 论文速递 ·

本文研究了大型语言模型Llama2在迭代囚徒困境中的合作行为。通过100轮游戏模拟，发现当对手背叛率低于30%时，Llama2表现出谨慎合作，其合作倾向优于人类参与者。这为LLMs在博弈理论中的应用提供了新思路。

机器能像人类思考吗？对大型语言模型代理在独裁者游戏中的行为评估

BriefGPT - AI 论文速递 ·

本研究提出了多语种大型语言模型（MLLMs）的开发与部署框架，分析了Llama2案例，并提出优化策略，强调支持语言多样性的重要性。

负责任的多语种大型语言模型：发展、应用与社会影响的综述

BriefGPT - AI 论文速递 ·

研究探讨了在特定领域使用大型语言模型进行代码生成的方法。通过数据分割和提示技术提升模型的思考深度，使用真实产品数据转化为语义向量，实现约70%的准确率。通过llama2微调实验验证其在专业领域代码生成中的有效性。

大语言模型在领域建模辅助中的实用性

BriefGPT - AI 论文速递 ·

研究分析了大型语言模型Llama2在迭代囚徒困境中的合作行为。通过100轮游戏模拟，评估其对游戏规则的理解和决策能力。结果表明，Llama2倾向于不主动背叛，并在对手背叛率低于30%时采取谨慎合作策略，显示出较强的合作倾向。此研究为LLM在博弈理论中的应用提供了新思路，帮助指导其审核和对齐实践。

我想要自由！大语言模型在社交等级下的反社会行为和说服能力

BriefGPT - AI 论文速递 ·

研究显示，Llama2在迭代囚徒困境中倾向于合作。在100轮游戏中，当对手背叛率低于30%时，Llama2采取谨慎合作策略，表现出宽容不报复的行为。相比人类，Llama2更倾向合作。这为评估大型语言模型在社交环境中的行为提供了理论框架。

利用大型语言模型再现和扩展行为策略实验

BriefGPT - AI 论文速递 ·

本研究提出了首个针对立陶宛语的开放Llama2大语言模型（LLMs），并配套提供了问答数据集和流行LLM基准的翻译。研究表明，高质量的预训练数据集对模型在语言理解任务上的高效表现至关重要。

基于 Amazon Bedrock 和 Llama2 构建智能导购解决方案

亚马逊AWS官方博客 ·

研究人员通过将AI的“慢思考”结果蒸馏进“快思考”，使Llama2的表现提升了257%，超过了GPT4，同时降低了推理成本。他们使用了四种不同的系统2方法进行微调，发现这种模式使系统1模型的表现大幅提升，甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。

AI慢思考蒸馏进快思考，Llama2升至GPT4水平，不写过程也能做对题

量子位 ·

华为云社区分享了昇思MindSpore技术公开课，深度解析LLaMA2模型架构。LLaMA2是Meta AI公司发布的开放高效语言模型，具有优异性能。LLaMA2的训练数据增加了40%，上下文长度翻倍，并采用了分组查询注意力机制。核心算法包括RMS Normalization、Group Multi Query Attention和SwiGLU Activation Function。LLaMA2在知识能力上有优势，但在学科、语言、推理和理解能力上被其他模型超越。未来大模型的发展方向包括改变底层模型架构、优化预训练微调方法和采用混合专家模型等。

一文为你深度解析LLaMA2模型架构

华为云官方博客 ·

本研究使用大型语言模型评估了Llama2在机器翻译方面的能力，发现其对已见过的语言具有较高的BLEU分数。研究结果表明句法相似性并非决定翻译质量的主要因素，同时发现某些语言虽然训练数据较少，但与英语具有可比较的相关性，为构建以非英语语言为中心的多语言模型提供了新的可能性。

如何训练强大的罗马尼亚语语言模型（LLM），附带英文指导

BriefGPT - AI 论文速递 ·

在 Amazon EKS 上使用 AWS Trainium 训练 Llama2

亚马逊AWS官方博客 ·

本试验旨在对大规模言语模型进行微调，以习惯有限的GPU核算能力（单张P100）。通过采用LoRA办法，咱们能够高效地对模型进行调整，以便进一步应用于后续课程项目的开发。试验基于Llama2-7B模型进行，要求模型依据给定的金融新闻内容进行情感剖析，并以文字形式输出新闻的情感类别：”positive”、”neutral”或”negative”。为了进行试验，咱们需求装置一些必要的包。其间，peft是一个包括了咱们在本试验中将运用的LoRA办法的包。通过增加一些额外的参数，peft能够有效地对大规模的言语模型进行微调，以习惯各种下流使命。另一个包是bitsandbytes，它提供了对模型进行4-bit量化的支持，这样能够进一步削减显存的运用，节约资源。

【vLLM 学习】Multilora Inference

使用LLaMA2进行LLM基准测试：评估多种编程语言的代码开发性能

本地对话助手：保护隐私的开源 GPT 项目 | 开源日报 No.498

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

首个！四大高校联合推出药物研发大语言模型Y-Mol，性能全面领先LLaMA2

在危机场景中利用大语言模型进行机器翻译：低资源语言的蓝图

机器能像人类思考吗？对大型语言模型代理在独裁者游戏中的行为评估

负责任的多语种大型语言模型：发展、应用与社会影响的综述

大语言模型在领域建模辅助中的实用性

我想要自由！大语言模型在社交等级下的反社会行为和说服能力

利用大型语言模型再现和扩展行为策略实验

立陶宛语的开放Llama2模型

基于 Amazon Bedrock 和 Llama2 构建智能导购解决方案

AI慢思考蒸馏进快思考，Llama2升至GPT4水平，不写过程也能做对题

一文为你深度解析LLaMA2模型架构

如何训练强大的罗马尼亚语语言模型（LLM），附带英文指导

在 Amazon EKS 上使用 AWS Trainium 训练 Llama2

LoRA对Llama2-7B进行微调

RAG实操教程，LangChain + Llama2 | 创造你的个人LLM

七月论文审稿GPT第4.2版：通过15K条paper-review数据微调Llama2 70B(含各种坑)