小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

作者分享了使用512GiB内存的Mac Studio M3 Ultra进行远程操作和运行LLM模型的体验。尽管配置简单,但遇到内存压力和程序卡死的问题。最终选择了LM Studio,发现其功能更强大。虽然性能优秀,但作者认为除了LLM外,其他用途较少,感到有些浪费。

Mac Studio M3 Ultra使用体验

Mayx的博客
Mayx的博客 · 2025-05-06T16:00:00Z

本研究提出了SlimPipe技术,旨在解决长上下文大型语言模型训练中的内存压力和效率瓶颈。通过均匀切片和前后调度,SlimPipe显著提高了模型的FLOPs利用率,尤其在处理超过2048K的上下文时,利用率超过45%,优于现有方法。

SlimPipe: A Memory-Efficient and High-Performance Pipeline Parallelism Technique for Training Long-Context Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z
解决MongoDB副本集节点数据大小差异问题

在使用WiredTiger存储引擎的MongoDB复制环境中,通过降低replBatchLimitOperations和replWriterThreadCount参数来减轻内存压力,减少PRIMARY和SECONDARY节点之间的数据大小差异风险。更改应逐步应用和测试,以评估对复制性能的影响。

解决MongoDB副本集节点数据大小差异问题

Percona Database Performance Blog
Percona Database Performance Blog · 2024-08-23T13:17:00Z

WasmGC是一种新的垃圾收集方法,可有效引入WebAssembly。它可以提供更好的性能潜力和更小的代码大小。WasmGC可以感知内存压力并相应地调整堆大小和收集频率,避免内存碎片化。虚拟机管理GC对象,因此可以更好地集成开发工具。在WasmGC移植中,需要编写新代码将语言结构转换为WasmGC基元。

将GC编程语言引入WebAssembly的新方法

极道
极道 · 2023-11-03T10:12:00Z

Instagram引入了Immortal Objects,实现真正的并行性。Meta使用预分叉Web服务器架构来缓存对象,但私有内存增加,共享内存减少。为解决问题,引入了Immortal对象,增加对象的不变性。Depop与Tecton合作提供特征存储。

Python将引入不变对象等本周互联网大厂博文推荐

极道
极道 · 2023-08-26T00:55:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码