小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Redis之父antirez发布DeepSeek V4 Flash专用推理引擎,128GB MacBook本地跑284B参数大模型

意大利程序员Salvatore Sanfilippo(antirez)发布了新开源项目ds4.c,专为DeepSeek V4 Flash设计的推理引擎。该项目利用Metal GPU,支持高达100万Token的上下文窗口,推理速度极快,适合长文档处理。ds4.c提供CLI和服务器模式,支持本地HTTP服务和磁盘KV缓存,提升了Agent客户端的使用体验。

Redis之父antirez发布DeepSeek V4 Flash专用推理引擎,128GB MacBook本地跑284B参数大模型

dotNET跨平台
dotNET跨平台 · 2026-05-10T00:01:48Z

本文提出了多种改进Transformer模型的注意力机制,包括线性统一嵌套注意力机制Luna、门控循环模型GateLoop和门控线性注意力(GLA),这些方法在性能和内存成本上均有显著提升。ViG模型在计算机视觉任务中表现优异,具有效率和可扩展性。

门控插槽注意力用于高效线性时间序列建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

本文探讨了大型语言模型(LLMs)对世界信念的表达及其置信度评估,提出了准确度、连贯性、一致性和应用等标准来评估不同置信度估计方法的有效性。实验结果表明,训练的隐藏状态探针提供了最可靠的置信度估计,但在语义等效输入下,模型的置信度表现不稳定,显示出改进的空间。此外,研究还探讨了引用方法在长文档处理中的应用,提出了自信度引出方法及其优缺点,并强调了对模型置信度的重新校准。

关于对大型语言模型的置信度归属

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码