小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Ollama量化全指南:3种方法+量化级别参考,普通电脑也能跑大模型

本文介绍了Ollama大模型的量化技术,旨在降低模型对硬件资源的消耗,使其在普通电脑上流畅运行。量化通过降低参数精度,显著减少显存和内存占用,同时提升计算速度。文章详细说明了量化的原理、实操方法及不同量化级别的选择,适合新手快速上手。

Ollama量化全指南:3种方法+量化级别参考,普通电脑也能跑大模型

人言兑
人言兑 · 2026-04-25T17:05:35Z
谷歌一篇论文砸崩内存巨头?不懂“显存墙”,怎么做 AI 时代的工程师!

谷歌的论文《TurboQuant》提出了一种极端压缩算法,能将大模型推理中的KV缓存减少6倍,计算速度提升8倍。这一进展导致存储巨头股价下跌,因其影响内存需求。AI工程师需掌握GPU和内存管理,以应对大模型部署挑战。

谷歌一篇论文砸崩内存巨头?不懂“显存墙”,怎么做 AI 时代的工程师!

Tony Bai
Tony Bai · 2026-03-28T00:18:15Z

谷歌量子团队提出的“量子回声”算法使计算速度提升13000倍,解决了量子计算结果验证的难题。该算法可重复验证,适用于原子、粒子相互作用及分子结构研究,推动药物研发和材料科学的发展。新晋诺奖得主Michel Devoret参与了该研究,展示了量子计算的实用优势。

刚拿诺奖就登Nature封面!谷歌“量子回声”算法计算提速13000倍,可重复验证结果

量子位
量子位 · 2025-10-22T15:40:18Z

微软研究院推出了大规模大气基础模型Aurora,利用超过一百万小时的地球物理数据进行预训练,显著提升了空气质量、海洋波浪和热带气旋路径的预测精度与效率,计算速度提高约5000倍,推动气候和天气信息获取。

内含教程丨微软Aurora计算速度提升5000倍,可预测极端天气/空气质量/海浪/气旋路径等

HyperAI超神经
HyperAI超神经 · 2025-05-29T12:18:49Z

该研究提出了一种快速熵近似(FEA)方法,显著降低了香农熵计算的成本和不稳定性。FEA的计算速度提高约50%,平均绝对误差为$10^{-3}$,在特征选择中表现出更高的效率和经济性。

快速的香农熵近似

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

中国初创企业曦智科技的光电混合芯片PACE在《Nature》上发表,计算速度比传统GPU快500倍,延迟仅3纳秒。该芯片集成了16000个光子组件,采用光电混合架构,解决了光子计算的技术难题,推动了商业化进程。

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

量子位
量子位 · 2025-04-14T06:06:10Z
如何在Python中调用Go代码:用Go加速Python

本文探讨了如何通过动态链接库(DLL)结合Python和Go语言,以提升开发效率和计算速度。Python以简洁的语法和丰富的库适合数据科学和人工智能,而Go语言则以高效的并发性能适合构建高性能网络服务。将Go的复杂计算部分编译为DLL并在Python中调用,可以充分发挥两者的优势。

如何在Python中调用Go代码:用Go加速Python

DEV Community
DEV Community · 2025-04-08T10:34:49Z
快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

研究人员开发了深度学习框架FPL-net,显著加速了非线性Fokker-Planck-Landau碰撞算子的计算,速度提升达到1000倍,误差仅为十万分之一。这一进展将提高等离子体模拟的效率和准确性,但目前仅适用于电子等离子体。

快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

机器之心
机器之心 · 2025-03-06T05:37:00Z
YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

AIxiv专栏报道了YOLOv12模型的创新,采用区域注意力机制和残差高效层聚合网络,显著提升了计算速度和优化稳定性。YOLOv12在多个指标上超越前代模型,展现出更强的实时目标检测能力。

YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

机器之心
机器之心 · 2025-02-22T06:05:20Z

本文提出了一种神经代理模型,用于高效建模核聚变能量生产中的等离子体湍流,计算速度比传统数值方法快两个数量级,为商业核聚变的可行性提供了基础。

5D Neural Surrogate Model for Nonlinear Gyrokinetic Plasma Turbulence

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z
迈向ISO C++ 26标准:人工智能加速的优势

C++ 26标准的制定面临挑战,需要平衡各方利益。尽管内存安全提案存在争议,委员会一致认为应提升计算速度和并行性。新特性包括senders/receivers、std::simd和反射,线性代数也将纳入标准。安全性改进虽重要,但进展缓慢。

迈向ISO C++ 26标准:人工智能加速的优势

The New Stack
The New Stack · 2024-12-06T16:09:18Z

本文介绍了一种新的Token修剪方法,旨在优化transformer模型的推理成本。通过逐层自适应修剪低得分Token,提升性能2.5%,降低FLOPs,增强处理器和GPU的吞吐量。研究还提出了Token Pruning & Squeezing模块和动态视觉转换器的蒙版微调,显著提高了模型的计算速度和准确性,同时降低了计算复杂度。

训练噪声令牌剪枝

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了一种新型的PACE操作符,显著提高了光子器件设计的仿真精度和速度,仿真精度提升73%,速度提升577倍,从而增强了光子电路设计的效率和可扩展性。

PACE: Pacing Operator Learning for Accurate Optical Field Simulation of Complex Photonic Devices

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本研究提出WIND框架,以解决迭代最佳-N蒸馏算法的高成本问题,实验结果表明其在计算速度和样本效率上优于现有方法。

Fast WIND: Accelerating Iterative Best-N Distillation for Large Language Model Alignment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z
未来是量子:量子计算如何改变科技!

量子计算利用量子比特(qubits)同时处理多个状态,超越传统计算机。近期研究提升了其计算速度和准确性,预计将革新密码学、人工智能和医疗等领域。

未来是量子:量子计算如何改变科技!

DEV Community
DEV Community · 2024-10-26T01:53:37Z

研究表明,在有限硬件上使用16位精度的深度学习模型可以在保持准确性的同时提高计算速度。16位精度在GPU上广泛可用,对资源有限的从业者尤为重要。研究还建议进一步探索更低精度的潜力。

在有限硬件上释放深度学习的潜力:独立16位精度的应用

DEV Community
DEV Community · 2024-10-14T10:18:48Z

数字图像处理是转换、增强和解释图像的领域,边缘检测是其中的基础技术之一。通过数学运算识别像素强度的变化,检测图像中的对象和边界。边缘检测对于分割和物体识别等任务至关重要。本项目使用Prewitt算子并行化边缘检测,加快计算速度。

🚀 使用线程和MiniMagick在Ruby中进行边缘检测 🌄

DEV Community
DEV Community · 2024-09-12T01:53:17Z

该文章探讨了机器学习在流体力学中的应用,包括其历史、现状和未来机会。机器学习提高了流体动力学模型的精度和计算速度,优化了模拟过程,并在实验流体力学中展现出重要前景。研究表明,机器学习能够有效处理复杂流动并提高模拟质量。

机器学习在计算流体动力学中的近期进展:一项综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文介绍了使用半精度浮点数训练深度神经网络的技术,显著提高了计算速度并减少了内存消耗。实验表明,该方法在多个数据集上性能优于传统精度。还探讨了混合精度框架的优化技巧及其对模型训练的影响,并提出了新的量化方法以提高推理效率。

一种基于度量的混合精度训练方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z

本文介绍了多种基于深度强化学习的优化方法,包括LoopTune编译器、Mind Mappings搜索方法、QuantTune微调技术和AutoCkt框架,旨在提升深度学习模型和电路设计的性能,优化计算速度、能量效率和设计流程。

MapTune: 强化学习指导的 ASIC 技术映射中的进阶库优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码