小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究介绍了适用于东南亚语言的最新版本SeaLLMs 3模型系列,该模型在多种语言中取得了优秀的性能,表明先进的大型语言模型能够造福语言和文化相对较少关注的社区。

SeaLLMs 3:东南亚语言的开放基础和聊天多语言大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z
探索 Claude 的新纪元 [译]

我们推出了Claude 3模型系列,包括Haiku、Sonnet和Opus。这些模型在认知任务上设定了新的高标准,提升了性能和智能水平。Opus和Sonnet已经可用,Haiku即将推出。模型在多个能力评测基准上表现出色,具有快速响应、视觉处理能力和准确性提升等特点。模型减少了拒绝回答问题的情况,并具备出色的记忆和回溯能力。模型设计注重安全性和用户友好性。模型已通过API提供,并计划在其他平台上推出。我们将继续推出更新和新功能,以提升模型性能。

探索 Claude 的新纪元 [译]

宝玉的分享
宝玉的分享 · 2024-03-04T20:00:00Z

该文章介绍了支持高达32,768个令牌的长上下文LLMs,通过持续预训练构建模型系列,并在多个任务和基准测试中进行了评估。70B变体已经超过了gpt-3.5-turbo-16k在一套长上下文任务中的整体性能。同时,文章还对Llama的位置编码进行了深入研究,并讨论了预训练过程中各种设计选择的影响。

LongQLoRA:扩展大型语言模型上下文长度的高效有效方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-08T00:00:00Z

该文介绍了支持高达32,768个令牌的长上下文LLMs,通过持续预训练构建模型系列,在语言模型、合成上下文探索任务以及广泛的研究基准上取得了显著提升。作者对Llama的位置编码和预训练过程中的设计选择进行了深入分析,验证了长上下文持续预训练相对于从头开始的长序列预训练更高效且同样有效。

CacheGen:面向语言模型应用的快速上下文加载

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-11T00:00:00Z

该文介绍了支持高达32,768个令牌的长上下文LLMs,通过持续预训练构建模型系列,并在多项任务上进行了评估。70B变体已经超过了gpt-3.5-turbo-16k在一套长上下文任务中的整体性能。同时,该文还对Llama的位置编码进行了深入研究,并讨论了预训练过程中各种设计选择的影响。

Mistral 7B

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码