小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

记忆张量与商汤大装置联合推出的国产GPGPU推理集群,性价比超越NVIDIA A100,提升了吞吐量和并发能力。通过“记忆—计算—调度”一体化设计,突破了传统性能限制,推动了大模型的商业化进程,标志着国产算力体系的重大进步。

记忆张量 × 商汤大装置:国产 GPGPU 推理成本反超 A100!

量子位
量子位 · 2025-12-04T03:07:42Z
Raphael AI 2.0 – 半年没停?富哥A100显卡免费服务还在,羊毛又能薅一波

Raphael AI 是一款无需注册、免费使用的 AI 绘图工具,新增了图片编辑功能。尽管提供免费服务,但部分功能需付费。用户可通过自然语言描述进行专业级图片编辑,支持多种风格和效果。

Raphael AI 2.0 – 半年没停?富哥A100显卡免费服务还在,羊毛又能薅一波

小众软件
小众软件 · 2025-07-27T12:23:51Z
在A100 80Gb上运行Nvidia COSMOS

本文介绍如何在Ubuntu 22.04上快速设置Nvidia Cosmos,包括驱动、Docker和CUDA依赖的安装。需要强大的Nvidia GPU和200GB以上的存储空间。通过运行两个脚本完成系统更新和Docker配置,最后下载模型并生成视频。

在A100 80Gb上运行Nvidia COSMOS

DEV Community
DEV Community · 2025-01-13T01:32:48Z
无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100

EAGLE-2是一种加速大语言模型推理速度的方法,使用动态草稿树投机采样。它可以将推理速度提高5倍,同时保持输出分布不变。EAGLE-2在多项任务上实验,结果显示其加速比和平均接受长度最高。EAGLE-2在工业界也得到了应用。

无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100

机器之心
机器之心 · 2024-07-17T06:52:58Z
单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速

微软的研究提出了一种名为MInference的稀疏计算方法,可以加速长上下文语言模型(LLM)的预填充阶段,无需修改预训练设置或额外微调,同时保持准确性。MInference通过动态稀疏注意力计算和优化的GPU内核,在单个A100上实现了10倍的推理速度提升。实验结果表明MInference在各种任务和模型下都表现良好。

单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速

机器之心
机器之心 · 2024-07-08T08:18:50Z
早报|英伟达成全球市值第一公司/华为高管称昇腾 AI 算力已超英伟达 A100/马斯克称未来人形机器人普及程度将是汽车 10 倍

英伟达成全球市值第一公司,华为高管称昇腾AI算力超英伟达A100,马斯克称人形机器人普及程度将是汽车10倍。

早报|英伟达成全球市值第一公司/华为高管称昇腾 AI 算力已超英伟达 A100/马斯克称未来人形机器人普及程度将是汽车 10 倍

爱范儿
爱范儿 · 2024-06-19T00:37:03Z

美国政府要求英伟达立即执行相关许可要求,不再允许提供30天的缓冲期。受影响的产品是A100、A800、H100、H800和L40S人工智能专用加速卡。中国企业无法再订购英伟达提供的专用加速卡,英伟达推出的新专用加速卡可能都无法再向中国企业出售。

美国要求英伟达H100/A100等出口管制立即生效 同时移除RTX 4090和L40

蓝点网
蓝点网 · 2023-10-25T08:14:30Z
早报|iPad Pro 明年将迎来重大更新 / X 推出招聘平台 / 刘庆峰称华为 GPU 已可对标英伟达 A100

财政部和税务总局宣布自2023年8月28日起,证券交易印花税减半征收。证监会发布公告收紧IPO节奏,规范减持行为,降低投资者融资买入证券时的融资保证金比例。马斯克推出招聘平台X Hiring,乔布斯亲笔撰写的Apple-1宣传手稿以175,759美元成交。刘庆峰表示华为GPU已媲美英伟达A100。新一代iPad Pro将迎来五年来首次重大更新,预计明年发布。

早报|iPad Pro 明年将迎来重大更新 / X 推出招聘平台 / 刘庆峰称华为 GPU 已可对标英伟达 A100

爱范儿
爱范儿 · 2023-08-28T00:25:23Z

普通电脑可以安装专业显卡,但需考虑兼容性和供电散热。选择消费级平台因云服务延迟和数据安全要求。主板需注意PCIe通道和插槽数,使用专用供电线和散热风扇。安装显卡驱动需注意BIOS设置和错误排查。普通电脑兼容专业显卡需遵循规则。

普通电脑安装使用A800/A100等专业显卡

轶哥
轶哥 · 2023-06-27T16:25:45Z

谷歌公布了使用自研TPU4组成的超级计算机,性能比NVIDIA A100超算快1.7倍、能效提高1.9倍。谷歌通过Google Cloud云计算服务对外出租Cloud TPU算力,但谷歌自研的芯片不对外出售。谷歌正在开发新一代TPU,与NVIDIA H100竞争。

谷歌吹嘘自研芯片TPU4组成的超算是英伟达A100超算性能的1.7倍

蓝点网
蓝点网 · 2023-04-06T14:33:19Z

Faster Training and Inference: Habana Gaudi®2 vs Nvidia A100 80GB

Hugging Face - Blog
Hugging Face - Blog · 2022-12-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码