小红花·文摘

本文比较了MySQL中不同批量操作方案的性能，分析了INSERT、UPDATE和DELETE操作的耗时及加速比。结果表明，管道化与事务结合的方案在处理大数据量时表现优异，INSERT和DELETE操作的加速比可达4x~5x。建议优先使用ExecuteArrayBatch与Pipeline组合进行批量DML操作。

NewLife.MySql 性能测试报告

dotNET跨平台 ·

该文章介绍了在RISC-V平台上实现的全流程Transformer模型推理结果，通过优化算法和硬件设计实现了高速和高效的计算。在编码器模型中，实现了12.8倍的加速比，在解码器模型中实现了35.6倍的加速。与专用加速器相比，实现了2.04倍的FPU利用率。

面向基于注意力机制的轻量级机器学习的异构加速架构和自动化部署流程

BriefGPT - AI 论文速递 ·

无损加速最高5x，EAGLE-2让RTX 3060的生成速度超过A100

机器之心 ·

该研究在RISC-V平台上实现了Transformer模型推理结果，通过分布式Softmax原语、ISA扩展、SIMD浮点操作和指令重复以及DMA引擎来提高性能。编码器模型实现了高达12.8倍的加速比，解码器模型在非自回归模式下实现了16.1倍的加速，自回归模式下实现了35.6倍的加速。与SoA专用加速器相比，FPU利用率提高了2.04倍。

在一个开源的 RISC-V 多微核平台上优化基础模型推理

BriefGPT - AI 论文速递 ·

该研究提出了一种新的大规模语言模型结构压缩方法ZipLM，能够在保证加速比的同时提供最先进的压缩精度结果。通过结构剪枝和知识蒸馏技术，ZipLM在GPT2模型上表现最佳。

基于波动的自适应结构修剪大型语言模型

BriefGPT - AI 论文速递 ·