小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Ollama量化全指南:3种方法+量化级别参考,普通电脑也能跑大模型

本文介绍了Ollama大模型的量化技术,旨在降低模型对硬件资源的消耗,使其在普通电脑上流畅运行。量化通过降低参数精度,显著减少显存和内存占用,同时提升计算速度。文章详细说明了量化的原理、实操方法及不同量化级别的选择,适合新手快速上手。

Ollama量化全指南:3种方法+量化级别参考,普通电脑也能跑大模型

人言兑
人言兑 · 2026-04-25T17:05:35Z
谷歌一篇论文砸崩内存巨头?不懂“显存墙”,怎么做 AI 时代的工程师!

谷歌的论文《TurboQuant》提出了一种极端压缩算法,能将大模型推理中的KV缓存减少6倍,计算速度提升8倍。这一进展导致存储巨头股价下跌,因其影响内存需求。AI工程师需掌握GPU和内存管理,以应对大模型部署挑战。

谷歌一篇论文砸崩内存巨头?不懂“显存墙”,怎么做 AI 时代的工程师!

Tony Bai
Tony Bai · 2026-03-28T00:18:15Z

谷歌量子团队提出的“量子回声”算法使计算速度提升13000倍,解决了量子计算结果验证的难题。该算法可重复验证,适用于原子、粒子相互作用及分子结构研究,推动药物研发和材料科学的发展。新晋诺奖得主Michel Devoret参与了该研究,展示了量子计算的实用优势。

刚拿诺奖就登Nature封面!谷歌“量子回声”算法计算提速13000倍,可重复验证结果

量子位
量子位 · 2025-10-22T15:40:18Z

微软研究院推出了大规模大气基础模型Aurora,利用超过一百万小时的地球物理数据进行预训练,显著提升了空气质量、海洋波浪和热带气旋路径的预测精度与效率,计算速度提高约5000倍,推动气候和天气信息获取。

内含教程丨微软Aurora计算速度提升5000倍,可预测极端天气/空气质量/海浪/气旋路径等

HyperAI超神经
HyperAI超神经 · 2025-05-29T12:18:49Z

该研究提出了一种快速熵近似(FEA)方法,显著降低了香农熵计算的成本和不稳定性。FEA的计算速度提高约50%,平均绝对误差为$10^{-3}$,在特征选择中表现出更高的效率和经济性。

快速的香农熵近似

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

中国初创企业曦智科技的光电混合芯片PACE在《Nature》上发表,计算速度比传统GPU快500倍,延迟仅3纳秒。该芯片集成了16000个光子组件,采用光电混合架构,解决了光子计算的技术难题,推动了商业化进程。

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

量子位
量子位 · 2025-04-14T06:06:10Z
如何在Python中调用Go代码:用Go加速Python

本文探讨了如何通过动态链接库(DLL)结合Python和Go语言,以提升开发效率和计算速度。Python以简洁的语法和丰富的库适合数据科学和人工智能,而Go语言则以高效的并发性能适合构建高性能网络服务。将Go的复杂计算部分编译为DLL并在Python中调用,可以充分发挥两者的优势。

如何在Python中调用Go代码:用Go加速Python

DEV Community
DEV Community · 2025-04-08T10:34:49Z
快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

研究人员开发了深度学习框架FPL-net,显著加速了非线性Fokker-Planck-Landau碰撞算子的计算,速度提升达到1000倍,误差仅为十万分之一。这一进展将提高等离子体模拟的效率和准确性,但目前仅适用于电子等离子体。

快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

机器之心
机器之心 · 2025-03-06T05:37:00Z
YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

AIxiv专栏报道了YOLOv12模型的创新,采用区域注意力机制和残差高效层聚合网络,显著提升了计算速度和优化稳定性。YOLOv12在多个指标上超越前代模型,展现出更强的实时目标检测能力。

YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

机器之心
机器之心 · 2025-02-22T06:05:20Z

本文提出了一种神经代理模型,用于高效建模核聚变能量生产中的等离子体湍流,计算速度比传统数值方法快两个数量级,为商业核聚变的可行性提供了基础。

5D Neural Surrogate Model for Nonlinear Gyrokinetic Plasma Turbulence

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z
迈向ISO C++ 26标准:人工智能加速的优势

C++ 26标准的制定面临挑战,需要平衡各方利益。尽管内存安全提案存在争议,委员会一致认为应提升计算速度和并行性。新特性包括senders/receivers、std::simd和反射,线性代数也将纳入标准。安全性改进虽重要,但进展缓慢。

迈向ISO C++ 26标准:人工智能加速的优势

The New Stack
The New Stack · 2024-12-06T16:09:18Z

本文介绍了一种新的Token修剪方法,旨在优化transformer模型的推理成本。通过逐层自适应修剪低得分Token,提升性能2.5%,降低FLOPs,增强处理器和GPU的吞吐量。研究还提出了Token Pruning & Squeezing模块和动态视觉转换器的蒙版微调,显著提高了模型的计算速度和准确性,同时降低了计算复杂度。

训练噪声令牌剪枝

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了一种基于Mamba模型的高效偏微分方程求解方案,显著提高计算速度,同时保持高预测精度。

LE-PDE++:用于加速偏微分方程模拟的Mamba模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出WIND框架,以解决迭代最佳-N蒸馏算法的高成本问题,实验结果表明其在计算速度和样本效率上优于现有方法。

快速WIND: 加速大型语言模型对齐的迭代最佳-N蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z
未来是量子:量子计算如何改变科技!

量子计算利用量子比特(qubits)同时处理多个状态,超越传统计算机。近期研究提升了其计算速度和准确性,预计将革新密码学、人工智能和医疗等领域。

未来是量子:量子计算如何改变科技!

DEV Community
DEV Community · 2024-10-26T01:53:37Z

研究表明,在有限硬件上使用16位精度的深度学习模型可以在保持准确性的同时提高计算速度。16位精度在GPU上广泛可用,对资源有限的从业者尤为重要。研究还建议进一步探索更低精度的潜力。

在有限硬件上释放深度学习的潜力:独立16位精度的应用

DEV Community
DEV Community · 2024-10-14T10:18:48Z

本研究提出一个多期调度模型,将人员排班与并行机器调度结合,目标是最小化总生产时间。模型考虑机器处理时间、设备时间和实际约束,采用混合整数线性规划和两步骤方法提高计算速度。通过合成实例和工业案例验证了模型的性能和实用性。

烤箱调度问题的理论下限

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

该论文综述了深度强化学习在机器调度问题中的方法和应用,发现DRL方法在计算速度和生成接近全局最优解方面表现优于其他方法。然而,DRL方法面临着处理复杂操作约束、多目标优化、泛化性、可扩展性、解释性和鲁棒性等限制。解决这些挑战将是未来研究的重点。该论文为研究人员提供了评估当前DRL机器调度领域现状和发现研究空白的资源,也帮助专家和从业者选择适合生产调度的DRL方法。

将强化学习作为现实生产调度的改进启发式方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

该论文综述了深度强化学习在机器调度问题中的方法和应用,发现DRL方法在计算速度和生成接近全局最优解方面表现优于其他方法。然而,DRL方法面临着处理复杂操作约束、多目标优化、泛化性、可扩展性、解释性和鲁棒性等限制。解决这些挑战将是未来研究的重点。该论文为研究人员提供了评估当前DRL机器调度领域现状和发现研究空白的资源,也帮助专家和从业者选择适合生产调度的DRL方法。

家具行业作业车间调度优化:考虑机器设置、批次变异和内部物流的强化学习方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

数字图像处理是转换、增强和解释图像的领域,边缘检测是其中的基础技术之一。通过数学运算识别像素强度的变化,检测图像中的对象和边界。边缘检测对于分割和物体识别等任务至关重要。本项目使用Prewitt算子并行化边缘检测,加快计算速度。

🚀 使用线程和MiniMagick在Ruby中进行边缘检测 🌄

DEV Community
DEV Community · 2024-09-12T01:53:17Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码