小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
n8n 模板大合集:助您高效创建自动化应用 | 开源日报 No.771

Llama-2-Open-Source-LLM-CPU-Inference 是一个本地运行 Llama 2 和开源大语言模型的项目,支持多种开发工具,增强数据隐私。awesome-n8n-templates 提供自动化模板以提高工作效率。playball 允许用户在终端观看 MLB 比赛,操作简便。BriefGPT 用于文档摘要,确保隐私安全。SkyAGI 展示 LLM 模拟人类行为的新能力。

n8n 模板大合集:助您高效创建自动化应用 | 开源日报 No.771

开源服务指南
开源服务指南 · 2025-10-28T07:35:15Z

该示例展示了如何使用多路线功能进行离线推理,需HuggingFace凭证访问Llama2,并使用LoRA适配器进行SQL查询。

【vLLM 学习】Multilora Inference

HyperAI超神经
HyperAI超神经 · 2025-09-19T11:27:30Z
构建类似于Llama-2和Llama-3的仅解码器变换器模型

本文介绍了如何构建一个仅解码器的变换器模型,类似于Meta的Llama-2和Llama-3。该模型专注于文本生成,通过自监督学习进行训练,使用古腾堡项目的小说作为数据集,最终能够根据输入提示生成连贯的文本。

构建类似于Llama-2和Llama-3的仅解码器变换器模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-08-04T16:02:37Z
在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练

近年来,深度学习模型日益复杂,单机训练效率低下。分布式训练技术可将负载分散到多台机器上,常用框架包括DeepSpeed和Horovod。本文介绍如何在亚马逊云上使用DeepSpeed进行Llama 2的分布式训练,涵盖环境搭建、Docker镜像构建及训练代码准备,以实现高效模型训练。

在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-06-24T08:25:25Z

本文研究了大型语言模型(LLMs)在软件开发自动化中的应用,着重评估Llama 2-70B模型在科学应用中的代码生成、文档撰写和单元测试能力。通过测试,我们发现该模型在简单任务中表现良好,但在复杂计算方面存在显著困难,亟需改进以更好地支持科学计算工作流程。

使用LLaMA2进行LLM基准测试:评估多种编程语言的代码开发性能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
本地对话助手:保护隐私的开源 GPT 项目 | 开源日报 No.498

DeepSeek-LLM 是一个拥有 67 亿参数的先进语言模型,经过大量数据训练,表现优于 Llama2 70B,特别在中文理解方面表现突出。该模型开源并提供多种版本。MagicTime 和 InstantStyle 分别用于视频生成和图像风格保持。localGPT 允许用户在本地安全对话,支持多种开源模型。gpt4free-ts 提供免费 GPT-4 API,降低使用成本。

本地对话助手:保护隐私的开源 GPT 项目 | 开源日报 No.498

开源服务指南
开源服务指南 · 2025-02-15T09:04:42Z
26年前老年机跑Llama2,每秒39个token:你的AI PC,也可以是Windows 98

EXO Labs成功在26年前的Windows 98奔腾II电脑上运行Llama 2,输出达到39.31 tok/秒,展示了人工智能在旧硬件上的潜力。该项目由牛津大学研究人员发起,旨在推动AI的普及,抵制少数公司对AI的控制。EXO通过古老的FTP传输文件,并使用Borland C++编译现代代码,实现了在老旧设备上运行AI模型的目标。

26年前老年机跑Llama2,每秒39个token:你的AI PC,也可以是Windows 98

机器之心
机器之心 · 2024-12-30T04:57:00Z

大语言模型Y-Mol在药物研发中展现出强大能力,解决了领域知识不足和数据获取难题,提升了药物-靶标及药物-药物相互作用的预测性能,为药物研发提供了新工具。

首个!四大高校联合推出药物研发大语言模型Y-Mol,性能全面领先LLaMA2

HyperAI超神经
HyperAI超神经 · 2024-11-07T07:16:20Z
Meta Spirit LM 在新的多模态生成AI模型中整合语音与文本

Meta最近推出的Spirit LM模型结合了语音和文本,克服了以往分开处理的局限。该模型基于7B的Llama 2,采用混合训练,能够保留情感信息。尽管文本性能略逊于Llama 2,Meta计划通过改进训练和使用更大模型来提升表现。Spirit LM目前仅支持英语,且缺乏防止滥用的安全措施。

Meta Spirit LM 在新的多模态生成AI模型中整合语音与文本

InfoQ
InfoQ · 2024-10-31T09:00:00Z

这篇论文探讨了使用开源Llama 2模型检测线上语言滥用的方法,显示其在内容审核和毒性检测中的高效性。研究发现,模型规模的增加对性能提升有限,而不同提示策略能显著提高检测效果。未来需关注模型的安全性和多样化标签,以改善仇恨言论检测的准确性。

DetoxBench:大型语言模型多任务欺诈与滥用检测基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本研究提出了首个针对立陶宛语的开放Llama2大语言模型(LLMs),并配套提供了问答数据集和流行LLM基准的翻译。研究表明,高质量的预训练数据集对模型在语言理解任务上的高效表现至关重要。

立陶宛语的开放Llama2模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-23T00:00:00Z

本研究探讨了双向语言模型(如BERT)在标记分类任务中的应用,并分析了更大的一维语言模型(如Llama-2)的潜力。实验结果表明,结合小型反向语言模型的表示能显著提升命名实体识别的性能,尤其在稀有领域和少量学习环境中效果显著。

Acquiring Bidirectionality via Large and Small Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z
Apple Teaches Large Models to Be Lazy: Faster Generation of the First Token While Maintaining Accuracy

苹果和Meta AI的研究团队提出了一种名为LazyLLM的新方法,可以在保持准确度的情况下提高Llama 2预填充阶段的推理速度。LazyLLM通过渐进式剪枝和辅助缓存来实现。实验结果表明,LazyLLM在加速推理方面表现优异,同时准确度下降可以忽略不计。LazyLLM的优势包括适用范围广、无需训练、效果好。

Apple Teaches Large Models to Be Lazy: Faster Generation of the First Token While Maintaining Accuracy

机器之心
机器之心 · 2024-08-02T06:40:12Z

我们开发了 Llama 2 系列大型语言模型,包括 Llama 2-Chat,表现优于其他开源聊天模型。TinyLlama 和 Code Llama 也展现了卓越性能。通过增强泰米尔语数据集,我们解决了语言代表性不足的问题,并引入 Llama Guard 提升安全性。研究表明,Llama 2-Chat 在生成问题方面优于其他模型,推动了语言建模的创新与发展。

Llama 3 模型群

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z
基于 Amazon Bedrock 和 Llama2 构建智能导购解决方案

该文章介绍了一种电商导购的实现方案,通过构建一个智能导购系统,利用大语言模型和电商推荐系统,识别用户购买意图并推荐合适的商品。方案包括准备购物对话样本数据、训练Llama2模型、识别购买意图、调用推荐系统API、生成推荐文案等步骤。文章还提供了部分参考代码和实现效果。

基于 Amazon Bedrock 和 Llama2 构建智能导购解决方案

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-07-19T07:28:14Z

该论文提出了一种结合检索增强生成技术和迁移学习的方法,以提升教科书问答中的推理能力。通过微调Llama-2模型并引入RAG,模型在多项选择题上的精度显著提高。此外,研究开发了智能QA助手ChaTA,并提出了基于RAG的聊天机器人框架,展示了其在信息检索和用户查询响应中的有效性。

ChatQA 2:在长篇文本和 RAG 能力中弥合专有 LLMs 的差距

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-19T00:00:00Z

研究人员通过将AI的“慢思考”结果蒸馏进“快思考”,使Llama2的表现提升了257%,超过了GPT4,同时降低了推理成本。他们使用了四种不同的系统2方法进行微调,发现这种模式使系统1模型的表现大幅提升,甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。

AI慢思考蒸馏进快思考,Llama2升至GPT4水平,不写过程也能做对题

量子位
量子位 · 2024-07-12T04:04:13Z

华为云社区分享了昇思MindSpore技术公开课,深度解析LLaMA2模型架构。LLaMA2是Meta AI公司发布的开放高效语言模型,具有优异性能。LLaMA2的训练数据增加了40%,上下文长度翻倍,并采用了分组查询注意力机制。核心算法包括RMS Normalization、Group Multi Query Attention和SwiGLU Activation Function。LLaMA2在知识能力上有优势,但在学科、语言、推理和理解能力上被其他模型超越。未来大模型的发展方向包括改变底层模型架构、优化预训练微调方法和采用混合专家模型等。

一文为你深度解析LLaMA2模型架构

华为云官方博客
华为云官方博客 · 2024-07-04T06:24:53Z

本文探讨了大型语言模型(LLMs)在医疗摘要任务中的表现,特别是开源模型Llama2和Mistral。研究采用GPT-4作为评估工具,发现其在特定任务中优于传统方法。LLMs在不同语言和文献类型上的表现存在差异,强调在系统综述中谨慎使用LLMs。总体而言,GPT-4在生成反馈和评估摘要方面表现良好。

大型语言模型作为科学综合评估器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-03T00:00:00Z

本文介绍了针对金融领域的中文情感分析数据集及其应用,提出了CFGPT框架和BBT-FinT5模型,并评估了大型语言模型在金融知识方面的表现。研究表明,经过微调的Llama 2模型在金融新闻分析中表现优异,FinLLMs方法有效提升了数值推理模型的性能。

FFN:一个细粒度的中英金融领域平行语料库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码