小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

记忆张量与商汤大装置联合推出的国产GPGPU推理集群,性价比超越NVIDIA A100,提升了吞吐量和并发能力。通过“记忆—计算—调度”一体化设计,突破了传统性能限制,推动了大模型的商业化进程,标志着国产算力体系的重大进步。

记忆张量 × 商汤大装置:国产 GPGPU 推理成本反超 A100!

量子位
量子位 · 2025-12-04T03:07:42Z
Raphael AI 2.0 – 半年没停?富哥A100显卡免费服务还在,羊毛又能薅一波

Raphael AI 是一款无需注册、免费使用的 AI 绘图工具,新增了图片编辑功能。尽管提供免费服务,但部分功能需付费。用户可通过自然语言描述进行专业级图片编辑,支持多种风格和效果。

Raphael AI 2.0 – 半年没停?富哥A100显卡免费服务还在,羊毛又能薅一波

小众软件
小众软件 · 2025-07-27T12:23:51Z
在A100 80Gb上运行Nvidia COSMOS

本文介绍如何在Ubuntu 22.04上快速设置Nvidia Cosmos,包括驱动、Docker和CUDA依赖的安装。需要强大的Nvidia GPU和200GB以上的存储空间。通过运行两个脚本完成系统更新和Docker配置,最后下载模型并生成视频。

在A100 80Gb上运行Nvidia COSMOS

DEV Community
DEV Community · 2025-01-13T01:32:48Z
无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100

EAGLE-2是一种加速大语言模型推理速度的方法,使用动态草稿树投机采样。它可以将推理速度提高5倍,同时保持输出分布不变。EAGLE-2在多项任务上实验,结果显示其加速比和平均接受长度最高。EAGLE-2在工业界也得到了应用。

无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100

机器之心
机器之心 · 2024-07-17T06:52:58Z
单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速

微软的研究提出了一种名为MInference的稀疏计算方法,可以加速长上下文语言模型(LLM)的预填充阶段,无需修改预训练设置或额外微调,同时保持准确性。MInference通过动态稀疏注意力计算和优化的GPU内核,在单个A100上实现了10倍的推理速度提升。实验结果表明MInference在各种任务和模型下都表现良好。

单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速

机器之心
机器之心 · 2024-07-08T08:18:50Z
早报|英伟达成全球市值第一公司/华为高管称昇腾 AI 算力已超英伟达 A100/马斯克称未来人形机器人普及程度将是汽车 10 倍

英伟达成全球市值第一公司,华为高管称昇腾AI算力超英伟达A100,马斯克称人形机器人普及程度将是汽车10倍。

早报|英伟达成全球市值第一公司/华为高管称昇腾 AI 算力已超英伟达 A100/马斯克称未来人形机器人普及程度将是汽车 10 倍

爱范儿
爱范儿 · 2024-06-19T00:37:03Z

美国政府要求英伟达立即执行相关许可要求,不再允许提供30天的缓冲期。受影响的产品是A100、A800、H100、H800和L40S人工智能专用加速卡。中国企业无法再订购英伟达提供的专用加速卡,英伟达推出的新专用加速卡可能都无法再向中国企业出售。

美国要求英伟达H100/A100等出口管制立即生效 同时移除RTX 4090和L40

蓝点网
蓝点网 · 2023-10-25T08:14:30Z
早报|iPad Pro 明年将迎来重大更新 / X 推出招聘平台 / 刘庆峰称华为 GPU 已可对标英伟达 A100

财政部和税务总局宣布自2023年8月28日起,证券交易印花税减半征收。证监会发布公告收紧IPO节奏,规范减持行为,降低投资者融资买入证券时的融资保证金比例。马斯克推出招聘平台X Hiring,乔布斯亲笔撰写的Apple-1宣传手稿以175,759美元成交。刘庆峰表示华为GPU已媲美英伟达A100。新一代iPad Pro将迎来五年来首次重大更新,预计明年发布。

早报|iPad Pro 明年将迎来重大更新 / X 推出招聘平台 / 刘庆峰称华为 GPU 已可对标英伟达 A100

爱范儿
爱范儿 · 2023-08-28T00:25:23Z

普通电脑可以安装专业显卡,但需考虑兼容性和供电散热。选择消费级平台因云服务延迟和数据安全要求。主板需注意PCIe通道和插槽数,使用专用供电线和散热风扇。安装显卡驱动需注意BIOS设置和错误排查。普通电脑兼容专业显卡需遵循规则。

普通电脑安装使用A800/A100等专业显卡

轶哥
轶哥 · 2023-06-27T16:25:45Z

谷歌公布了使用自研TPU4组成的超级计算机,性能比NVIDIA A100超算快1.7倍、能效提高1.9倍。谷歌通过Google Cloud云计算服务对外出租Cloud TPU算力,但谷歌自研的芯片不对外出售。谷歌正在开发新一代TPU,与NVIDIA H100竞争。

谷歌吹嘘自研芯片TPU4组成的超算是英伟达A100超算性能的1.7倍

蓝点网
蓝点网 · 2023-04-06T14:33:19Z

Faster Training and Inference: Habana Gaudi®2 vs Nvidia A100 80GB

Hugging Face - Blog
Hugging Face - Blog · 2022-12-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码