小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
n8n 模板大合集:助您高效创建自动化应用 | 开源日报 No.771

Llama-2-Open-Source-LLM-CPU-Inference 是一个本地运行 Llama 2 和开源大语言模型的项目,支持多种开发工具,增强数据隐私。awesome-n8n-templates 提供自动化模板以提高工作效率。playball 允许用户在终端观看 MLB 比赛,操作简便。BriefGPT 用于文档摘要,确保隐私安全。SkyAGI 展示 LLM 模拟人类行为的新能力。

n8n 模板大合集:助您高效创建自动化应用 | 开源日报 No.771

开源服务指南
开源服务指南 · 2025-10-28T07:35:15Z

该示例展示了如何使用多路线功能进行离线推理,需HuggingFace凭证访问Llama2,并使用LoRA适配器进行SQL查询。

【vLLM 学习】Multilora Inference

HyperAI超神经
HyperAI超神经 · 2025-09-19T11:27:30Z
构建类似于Llama-2和Llama-3的仅解码器变换器模型

本文介绍了如何构建一个仅解码器的变换器模型,类似于Meta的Llama-2和Llama-3。该模型专注于文本生成,通过自监督学习进行训练,使用古腾堡项目的小说作为数据集,最终能够根据输入提示生成连贯的文本。

构建类似于Llama-2和Llama-3的仅解码器变换器模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-08-04T16:02:37Z
在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练

近年来,深度学习模型日益复杂,单机训练效率低下。分布式训练技术可将负载分散到多台机器上,常用框架包括DeepSpeed和Horovod。本文介绍如何在亚马逊云上使用DeepSpeed进行Llama 2的分布式训练,涵盖环境搭建、Docker镜像构建及训练代码准备,以实现高效模型训练。

在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-06-24T08:25:25Z

本文研究了大型语言模型(LLMs)在软件开发自动化中的应用,着重评估Llama 2-70B模型在科学应用中的代码生成、文档撰写和单元测试能力。通过测试,我们发现该模型在简单任务中表现良好,但在复杂计算方面存在显著困难,亟需改进以更好地支持科学计算工作流程。

使用LLaMA2进行LLM基准测试:评估多种编程语言的代码开发性能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
本地对话助手:保护隐私的开源 GPT 项目 | 开源日报 No.498

DeepSeek-LLM 是一个拥有 67 亿参数的先进语言模型,经过大量数据训练,表现优于 Llama2 70B,特别在中文理解方面表现突出。该模型开源并提供多种版本。MagicTime 和 InstantStyle 分别用于视频生成和图像风格保持。localGPT 允许用户在本地安全对话,支持多种开源模型。gpt4free-ts 提供免费 GPT-4 API,降低使用成本。

本地对话助手:保护隐私的开源 GPT 项目 | 开源日报 No.498

开源服务指南
开源服务指南 · 2025-02-15T09:04:42Z
26年前老年机跑Llama2,每秒39个token:你的AI PC,也可以是Windows 98

EXO Labs成功在26年前的Windows 98奔腾II电脑上运行Llama 2,输出达到39.31 tok/秒,展示了人工智能在旧硬件上的潜力。该项目由牛津大学研究人员发起,旨在推动AI的普及,抵制少数公司对AI的控制。EXO通过古老的FTP传输文件,并使用Borland C++编译现代代码,实现了在老旧设备上运行AI模型的目标。

26年前老年机跑Llama2,每秒39个token:你的AI PC,也可以是Windows 98

机器之心
机器之心 · 2024-12-30T04:57:00Z

大语言模型Y-Mol在药物研发中展现出强大能力,解决了领域知识不足和数据获取难题,提升了药物-靶标及药物-药物相互作用的预测性能,为药物研发提供了新工具。

首个!四大高校联合推出药物研发大语言模型Y-Mol,性能全面领先LLaMA2

HyperAI超神经
HyperAI超神经 · 2024-11-07T07:16:20Z
Meta Spirit LM 在新的多模态生成AI模型中整合语音与文本

Meta最近推出的Spirit LM模型结合了语音和文本,克服了以往分开处理的局限。该模型基于7B的Llama 2,采用混合训练,能够保留情感信息。尽管文本性能略逊于Llama 2,Meta计划通过改进训练和使用更大模型来提升表现。Spirit LM目前仅支持英语,且缺乏防止滥用的安全措施。

Meta Spirit LM 在新的多模态生成AI模型中整合语音与文本

InfoQ
InfoQ · 2024-10-31T09:00:00Z

本文介绍了一种基于开源语言模型LLAMA2的新方法,旨在从社交媒体和紧急信息中识别和分类紧急情况,以帮助公共安全通信员和用户。该模型能够理解911呼叫内容,提供指导并通知相关部门,尤其在911系统繁忙时,有效传递用户位置和紧急信息。

在危机场景中利用大语言模型进行机器翻译:低资源语言的蓝图

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文研究了大型语言模型Llama2在迭代囚徒困境中的合作行为。通过100轮游戏模拟,发现当对手背叛率低于30%时,Llama2表现出谨慎合作,其合作倾向优于人类参与者。这为LLMs在博弈理论中的应用提供了新思路。

机器能像人类思考吗?对大型语言模型代理在独裁者游戏中的行为评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本研究提出了多语种大型语言模型(MLLMs)的开发与部署框架,分析了Llama2案例,并提出优化策略,强调支持语言多样性的重要性。

负责任的多语种大型语言模型:发展、应用与社会影响的综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

我们开发了支持32,768个令牌的长上下文语言模型,通过持续预训练提升了长文本处理能力。模型在语言任务和研究基准上表现优异,尤其在长上下文任务上超越了Llama 2和gpt-3.5-turbo-16k。研究发现,长上下文预训练比从头开始的长序列预训练更高效,并分析了位置编码和预训练设计对性能的影响。

通过同源模型引导和上下文感知测量选择具有影响力的样本以实现长期上下文对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

OpenVLA是一个拥有7B参数的开源视觉-语言-动作模型,利用970k真实机器人演示数据集训练。基于Llama 2和DINOv2,OpenVLA在29个任务中表现出色,成功率比RT-2-X高16.5%。在新环境中微调效果优于传统模仿学习方法20.4%,并能在消费级GPU上高效微调,提供模型检查点和代码库支持。

Flex:基于基础模型的文本指令视觉导航的端到端方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

研究探讨了在特定领域使用大型语言模型进行代码生成的方法。通过数据分割和提示技术提升模型的思考深度,使用真实产品数据转化为语义向量,实现约70%的准确率。通过llama2微调实验验证其在专业领域代码生成中的有效性。

大语言模型在领域建模辅助中的实用性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

研究评估了Llama 2模型在数学公式数据集上的表现。结果表明,增大模型规模和进行微调能显著提升性能,尤其在简单公式上效果明显。但即使是最大的微调模型,仍有挑战。

执行算术:将大型语言模型微调为图灵机

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

研究分析了大型语言模型Llama2在迭代囚徒困境中的合作行为。通过100轮游戏模拟,评估其对游戏规则的理解和决策能力。结果表明,Llama2倾向于不主动背叛,并在对手背叛率低于30%时采取谨慎合作策略,显示出较强的合作倾向。此研究为LLM在博弈理论中的应用提供了新思路,帮助指导其审核和对齐实践。

我想要自由!大语言模型在社交等级下的反社会行为和说服能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z

研究显示,Llama2在迭代囚徒困境中倾向于合作。在100轮游戏中,当对手背叛率低于30%时,Llama2采取谨慎合作策略,表现出宽容不报复的行为。相比人类,Llama2更倾向合作。这为评估大型语言模型在社交环境中的行为提供了理论框架。

利用大型语言模型再现和扩展行为策略实验

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z

OpenVLA是一个拥有7B参数的开源视觉-语言-动作模型,利用970k真实机器人演示数据集训练。基于Llama 2和DINOv2特征,OpenVLA在29个任务中表现优异,成功率比RT-2-X等闭源模型高16.5%。在新环境中微调效果显著,优于传统模仿学习方法20.4%。它可在消费级GPU上微调,并支持量化服务。模型检查点和代码库已发布,推动VLA的规模化训练。

LADEV:面向机器人操作的视觉语言行动模型的语言驱动测试与评估平台

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

我们开发了支持32,768个令牌的长上下文LLMs,通过持续预训练和长文本数据集构建。模型在语言任务和研究基准上表现优异,尤其在长上下文任务上超过Llama 2。70B变体在长上下文任务中优于gpt-3.5-turbo-16k。分析表明,长上下文持续预训练更高效。

InfiniPot:在内存受限的大型语言模型上进行无限上下文处理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码