小红花·文摘 - 小红花技术领袖俱乐部

作者分享了使用512GiB内存的Mac Studio M3 Ultra进行远程操作和运行LLM模型的体验。尽管配置简单，但遇到内存压力和程序卡死的问题。最终选择了LM Studio，发现其功能更强大。虽然性能优秀，但作者认为除了LLM外，其他用途较少，感到有些浪费。

Mac Studio M3 Ultra使用体验

Mayx的博客 ·

本研究提出了SlimPipe技术，旨在解决长上下文大型语言模型训练中的内存压力和效率瓶颈。通过均匀切片和前后调度，SlimPipe显著提高了模型的FLOPs利用率，尤其在处理超过2048K的上下文时，利用率超过45%，优于现有方法。

SlimPipe: A Memory-Efficient and High-Performance Pipeline Parallelism Technique for Training Long-Context Large Language Models

BriefGPT - AI 论文速递 ·

解决MongoDB副本集节点数据大小差异问题

解决MongoDB副本集节点数据大小差异问题

Percona Database Performance Blog ·

WasmGC是一种新的垃圾收集方法，可有效引入WebAssembly。它可以提供更好的性能潜力和更小的代码大小。WasmGC可以感知内存压力并相应地调整堆大小和收集频率，避免内存碎片化。虚拟机管理GC对象，因此可以更好地集成开发工具。在WasmGC移植中，需要编写新代码将语言结构转换为WasmGC基元。

将GC编程语言引入WebAssembly的新方法

极道 ·

Instagram引入了Immortal Objects，实现真正的并行性。Meta使用预分叉Web服务器架构来缓存对象，但私有内存增加，共享内存减少。为解决问题，引入了Immortal对象，增加对象的不变性。Depop与Tecton合作提供特征存储。

Python将引入不变对象等本周互联网大厂博文推荐

极道 ·