记忆张量与商汤大装置联合推出的国产GPGPU推理集群,性价比超越NVIDIA A100,提升了吞吐量和并发能力。通过“记忆—计算—调度”一体化设计,突破了传统性能限制,推动了大模型的商业化进程,标志着国产算力体系的重大进步。
Raphael AI 是一款无需注册、免费使用的 AI 绘图工具,新增了图片编辑功能。尽管提供免费服务,但部分功能需付费。用户可通过自然语言描述进行专业级图片编辑,支持多种风格和效果。
本文介绍如何在Ubuntu 22.04上快速设置Nvidia Cosmos,包括驱动、Docker和CUDA依赖的安装。需要强大的Nvidia GPU和200GB以上的存储空间。通过运行两个脚本完成系统更新和Docker配置,最后下载模型并生成视频。
EAGLE-2是一种加速大语言模型推理速度的方法,使用动态草稿树投机采样。它可以将推理速度提高5倍,同时保持输出分布不变。EAGLE-2在多项任务上实验,结果显示其加速比和平均接受长度最高。EAGLE-2在工业界也得到了应用。
微软的研究提出了一种名为MInference的稀疏计算方法,可以加速长上下文语言模型(LLM)的预填充阶段,无需修改预训练设置或额外微调,同时保持准确性。MInference通过动态稀疏注意力计算和优化的GPU内核,在单个A100上实现了10倍的推理速度提升。实验结果表明MInference在各种任务和模型下都表现良好。
英伟达成全球市值第一公司,华为高管称昇腾AI算力超英伟达A100,马斯克称人形机器人普及程度将是汽车10倍。
美国政府要求英伟达立即执行相关许可要求,不再允许提供30天的缓冲期。受影响的产品是A100、A800、H100、H800和L40S人工智能专用加速卡。中国企业无法再订购英伟达提供的专用加速卡,英伟达推出的新专用加速卡可能都无法再向中国企业出售。
财政部和税务总局宣布自2023年8月28日起,证券交易印花税减半征收。证监会发布公告收紧IPO节奏,规范减持行为,降低投资者融资买入证券时的融资保证金比例。马斯克推出招聘平台X Hiring,乔布斯亲笔撰写的Apple-1宣传手稿以175,759美元成交。刘庆峰表示华为GPU已媲美英伟达A100。新一代iPad Pro将迎来五年来首次重大更新,预计明年发布。
普通电脑可以安装专业显卡,但需考虑兼容性和供电散热。选择消费级平台因云服务延迟和数据安全要求。主板需注意PCIe通道和插槽数,使用专用供电线和散热风扇。安装显卡驱动需注意BIOS设置和错误排查。普通电脑兼容专业显卡需遵循规则。
谷歌公布了使用自研TPU4组成的超级计算机,性能比NVIDIA A100超算快1.7倍、能效提高1.9倍。谷歌通过Google Cloud云计算服务对外出租Cloud TPU算力,但谷歌自研的芯片不对外出售。谷歌正在开发新一代TPU,与NVIDIA H100竞争。
完成下面两步后,将自动完成登录并继续当前操作。