小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
别再省 Token 了!硅谷新共识:浪费算力才是唯一捷径

硅谷新共识认为,浪费算力是大模型时代的捷径。顶级创始人强调,使用多个AI模型解决问题比写提示词技巧更有效。未来程序员的角色将转变为构建自动化代码生产工厂,AI的崛起释放了创造力,使程序员能够更高效地实现创意。

别再省 Token 了!硅谷新共识:浪费算力才是唯一捷径

Tony Bai
Tony Bai · 2026-06-14T00:34:27Z

我们在首页新增了算力需求收集入口,允许未登录用户提交需求,系统通过邮件将需求发送给运营团队。此功能降低了用户提交需求的门槛,便于快速收集商机。

KeyCompute 新功能发布,「提交算力需求」表单 + 邮件接收流程

Rust.cc
Rust.cc · 2026-06-13T15:25:39Z
软通动力宣布“北京壹号词元工厂”正式投入运行

软通动力于6月11日宣布“北京壹号词元工厂”正式投入运行,标志着大模型算力进入标准化时代。该工厂专注于智能体服务,优化硬件性能和算法,提供高性价比的“数字燃料”——Token,并发布了开源的词元工厂性能基准,构建了完整的评测体系。软通动力还参与多个国家重点项目,推动全球AI合作。

软通动力宣布“北京壹号词元工厂”正式投入运行

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-11T06:13:00Z
Meta花1450亿美元建AI数据中心选址帐篷 | 借鉴特斯拉xAI策略

Meta在俄亥俄州搭建六个大型帐篷作为临时数据中心,以快速部署AI芯片,解决传统建设速度慢的问题。这一策略借鉴了特斯拉和xAI的做法,旨在加快算力上线,满足AI竞赛的需求。帐篷具备防风防雨功能,确保设备安全,可能改变数据中心建设的方式。

Meta花1450亿美元建AI数据中心选址帐篷 | 借鉴特斯拉xAI策略

极道
极道 · 2026-06-10T22:48:00Z
移远通信携全系车载智能解决方案参与2026高通汽车峰会

移远通信在2026高通汽车峰会上展示了全系车载智能解决方案,涵盖算力、AI和感知连接。基于高通芯片,推出多款舱联融合方案,已在多家车企落地。旗舰级AS900P方案具备强大算力并通过认证,同时研发车载AI大模型方案,支持多种主流大模型,提升人车交互体验。

移远通信携全系车载智能解决方案参与2026高通汽车峰会

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-08T10:15:04Z
华为自研HBM性能翻倍!昇腾950DT芯片8月提前问世,DeepSeek将优先部署

华为副总裁陈林透露,昇腾950DT芯片将于8月上线,算力翻倍,内存带宽提升至4TB/s。950PR和950DT两个版本分别针对不同市场需求,前者降低成本,后者专注高带宽场景。DeepSeek将优先部署950DT,预计在8月推出新版本,进一步提升AI模型能力。

华为自研HBM性能翻倍!昇腾950DT芯片8月提前问世,DeepSeek将优先部署

TechWeb 全站精华
TechWeb 全站精华 · 2026-06-08T01:58:14Z
谷歌与SpaceX达成3年AI算力合作 谷歌将每月支付9.2亿美元使用孟菲斯C1数据中心

谷歌与SpaceX达成合作,谷歌每月支付9.2亿美元使用SpaceX孟菲斯数据中心的11万台英伟达GPU,合作期为2026年10月至2029年6月。同时,SpaceX还与Anthropic合作,每月支付12.5亿美元使用22万台GPU。此举旨在提升SpaceX的AI业务,尽管其AI部门目前仍面临亏损和市场份额低的问题。

谷歌与SpaceX达成3年AI算力合作 谷歌将每月支付9.2亿美元使用孟菲斯C1数据中心

蓝点网
蓝点网 · 2026-06-06T04:58:00Z
有人靠CPU把AI算力密度卷到了新高度

英特尔推出新技术以应对Agentic AI的算力焦虑,提升AI算力密度,推动数据中心和AI的发展。

有人靠CPU把AI算力密度卷到了新高度

量子位
量子位 · 2026-06-05T13:16:53Z
如何降低AI对话开发成本及部署AI对话开发应用?

AI对话项目在规模化运营后,成本控制成为关键。主要成本包括算力、带宽、服务器和数据迭代。优化路径包括利用成熟平台、模型分级调度、资源优化和建立成本监控体系。部署方式有公有云、私有化和混合部署,需权衡安全、成本和弹性。稳定性保障至关重要,需做好监控和容灾备份。合理设计成本结构,借助专业平台合作,有助于实现可持续运营。

如何降低AI对话开发成本及部署AI对话开发应用?

实时互动网
实时互动网 · 2026-06-05T06:50:46Z
科技爱好者周刊(第 399 期):中国 AI 大厂访问记

今年5月,美国访问团考察了14家中国AI和机器人公司,发现中国在算力方面受限于美国的芯片出口管制,导致研发进展缓慢。尽管中国公司在效率上有所提升,但整体算力仍落后于美国。中国AI市场对开源模型存在分歧,部分公司倾向于将大模型托管在云端而非开源。年轻研究人员对AGI持开放态度,认为安全问题应由政府解决。中国企业对AI服务的需求正在向云计算转变。

科技爱好者周刊(第 399 期):中国 AI 大厂访问记

阮一峰的网络日志
阮一峰的网络日志 · 2026-06-05T00:07:45Z
英博数科亮相CCIG 2026,首次公开EBFlex私有化算力管理平台

2026年中国图象图形大会将在广州举行,重点关注图象图形与人工智能等前沿技术。英博数科展示了EBFlex私有化算力管理平台,旨在提升高校科研算力的供给与管理效率。该平台支持统一管理本地GPU资源,并与EBCloud公有云服务协同,解决算力高峰问题,推动高校科研算力的服务化与平台化发展。

英博数科亮相CCIG 2026,首次公开EBFlex私有化算力管理平台

量子位
量子位 · 2026-06-04T07:25:26Z

KeyCompute 是一个 AI Token 算力服务平台,旨在帮助中小企业和开发者管理多模型混用、账号池和计费等复杂链路。该平台使用 Rust 语言构建,提供双层路由引擎、实时计费和闲置算力接入等功能,确保高效、可扩展的基础设施,并采用清晰的架构设计,强调依赖单向性和可选依赖,避免并发和精度问题。

构建新一代 AI Token 算力服务平台:KeyCompute 技术架构剖析

Rust.cc
Rust.cc · 2026-06-04T03:30:44Z
微软发布Surface RTX SPARK开发工作站 利用英伟达芯片提供本地AI算力

微软推出了 Microsoft Surface RTX SPARK 开发工作站,搭载英伟达芯片,支持本地运行 AI 模型。该工作站配备 20 核心 CPU 和 6144 CUDA 核心的 GPU,内存为 128GB,外壳采用阳极氧化铝,设有1000个散热孔,确保高负荷下保持凉爽。预计将于今年晚些时候在美国市场发布。

微软发布Surface RTX SPARK开发工作站 利用英伟达芯片提供本地AI算力

蓝点网
蓝点网 · 2026-06-03T04:30:38Z
Alphabet官宣800亿美元天量融资,重金押注AI基建与算力

谷歌母公司Alphabet宣布融资800亿美元,主要用于人工智能基础设施和算力建设。融资方式包括公开发行300亿美元、按市值发行400亿美元及伯克希尔·哈撒韦注资100亿美元。这一举措显示了Alphabet在AI领域的扩张决心,背后是云服务业务的快速增长。

Alphabet官宣800亿美元天量融资,重金押注AI基建与算力

TechWeb 全站精华
TechWeb 全站精华 · 2026-06-02T02:23:42Z

英伟达推出RTX SPARK超级芯片,结合ARM CPU和NVIDIA GPU,提供最高1 peta FLOP算力,支持本地AI模型运行。该芯片采用统一内存封装,适合创作者和游戏玩家,搭载该芯片的笔记本将于秋季上市,主要面向高端市场。

英伟达推出高端PC处理器RTX SPARK 提供1petaFLOP算力和最高128GB内存

蓝点网
蓝点网 · 2026-06-01T07:32:50Z
英伟达掀桌,Windows 终于迎来真 AI PC

英伟达在2026年COMPUTEX上推出RTX Spark处理器,旨在将个人电脑转变为AI平台。该处理器结合强大GPU和定制CPU,支持创作和游戏等多种应用场景。英伟达强调未来PC将成为AI智能体的核心,推动软件开发和生产力提升,并展示了AI工厂的构建蓝图,突显算力的重要性和商业逻辑的转变。

英伟达掀桌,Windows 终于迎来真 AI PC

爱范儿
爱范儿 · 2026-06-01T06:53:35Z
Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

在2026中国AIGC产业峰会上,亚马逊云科技的王晓野指出,虽然87%的企业声称已部署AI,但真正获益的仅有10%。他强调企业在实施AI Agent时面临模型选择、系统稳定性和人才缺口等挑战,并建议关注算力、模型、数据平台等五大能力,以实现AI的有效应用和价值提升。

Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

量子位
量子位 · 2026-06-01T05:32:24Z
Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

在2026中国AIGC产业峰会上,亚马逊云科技的王晓野指出,87%的企业已部署AI,但仅10%获得实际价值。他强调企业需解决模型选择、算力和数据安全等问题,以实现AI Agent的稳定运行。他提出五大能力,包括算力、模型、数据平台、Agent平台和应用,帮助企业从Demo转向生产,推动AI Agent的落地。

Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

量子位
量子位 · 2026-05-31T10:03:40Z
4nm!比亚迪自研AI芯片来了:制程对齐英伟达,算力拉爆特斯拉

比亚迪推出了中国首款车规级4纳米智驾芯片璇玑A3,具备超过2100 TOPS的算力,功耗比同类产品低20%。该芯片专为AI推理设计,提升算力利用率100%,并支持低延迟数据调度。比亚迪承诺在城市领航期间,因辅助驾驶导致的事故将全额赔偿,标志着中国车企在高端智驾芯片领域的突破。

4nm!比亚迪自研AI芯片来了:制程对齐英伟达,算力拉爆特斯拉

量子位
量子位 · 2026-05-29T14:30:20Z
清华系团队给大模型织了一张“智能算力电网”

是石科技成立于2021年,专注于通过并行优化技术提升国产AI算力效率,构建标准化、低成本的Token生产能力,解决算力资源碎片化问题。公司整合多种算力资源,优化推理过程,降低Token生产成本,提升吞吐量,推动中国AI产业的规模化和高质量发展。

清华系团队给大模型织了一张“智能算力电网”

量子位
量子位 · 2026-05-29T02:47:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码