小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
别再省 Token 了!硅谷新共识:浪费算力才是唯一捷径

硅谷新共识认为,浪费算力是大模型时代的捷径。顶级创始人强调,使用多个AI模型解决问题比写提示词技巧更有效。未来程序员的角色将转变为构建自动化代码生产工厂,AI的崛起释放了创造力,使程序员能够更高效地实现创意。

别再省 Token 了!硅谷新共识:浪费算力才是唯一捷径

Tony Bai
Tony Bai · 2026-06-14T00:34:27Z

我们在首页新增了算力需求收集入口,允许未登录用户提交需求,系统通过邮件将需求发送给运营团队。此功能降低了用户提交需求的门槛,便于快速收集商机。

KeyCompute 新功能发布,「提交算力需求」表单 + 邮件接收流程

Rust.cc
Rust.cc · 2026-06-13T15:25:39Z
软通动力宣布“北京壹号词元工厂”正式投入运行

软通动力于6月11日宣布“北京壹号词元工厂”正式投入运行,标志着大模型算力进入标准化时代。该工厂专注于智能体服务,优化硬件性能和算法,提供高性价比的“数字燃料”——Token,并发布了开源的词元工厂性能基准,构建了完整的评测体系。软通动力还参与多个国家重点项目,推动全球AI合作。

软通动力宣布“北京壹号词元工厂”正式投入运行

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-11T06:13:00Z
Meta花1450亿美元建AI数据中心选址帐篷 | 借鉴特斯拉xAI策略

Meta在俄亥俄州搭建六个大型帐篷作为临时数据中心,以快速部署AI芯片,解决传统建设速度慢的问题。这一策略借鉴了特斯拉和xAI的做法,旨在加快算力上线,满足AI竞赛的需求。帐篷具备防风防雨功能,确保设备安全,可能改变数据中心建设的方式。

Meta花1450亿美元建AI数据中心选址帐篷 | 借鉴特斯拉xAI策略

极道
极道 · 2026-06-10T22:48:00Z
移远通信携全系车载智能解决方案参与2026高通汽车峰会

移远通信在2026高通汽车峰会上展示了全系车载智能解决方案,涵盖算力、AI和感知连接。基于高通芯片,推出多款舱联融合方案,已在多家车企落地。旗舰级AS900P方案具备强大算力并通过认证,同时研发车载AI大模型方案,支持多种主流大模型,提升人车交互体验。

移远通信携全系车载智能解决方案参与2026高通汽车峰会

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-08T10:15:04Z
华为自研HBM性能翻倍!昇腾950DT芯片8月提前问世,DeepSeek将优先部署

华为副总裁陈林透露,昇腾950DT芯片将于8月上线,算力翻倍,内存带宽提升至4TB/s。950PR和950DT两个版本分别针对不同市场需求,前者降低成本,后者专注高带宽场景。DeepSeek将优先部署950DT,预计在8月推出新版本,进一步提升AI模型能力。

华为自研HBM性能翻倍!昇腾950DT芯片8月提前问世,DeepSeek将优先部署

TechWeb 全站精华
TechWeb 全站精华 · 2026-06-08T01:58:14Z
谷歌与SpaceX达成3年AI算力合作 谷歌将每月支付9.2亿美元使用孟菲斯C1数据中心

谷歌与SpaceX达成合作,谷歌每月支付9.2亿美元使用SpaceX孟菲斯数据中心的11万台英伟达GPU,合作期为2026年10月至2029年6月。同时,SpaceX还与Anthropic合作,每月支付12.5亿美元使用22万台GPU。此举旨在提升SpaceX的AI业务,尽管其AI部门目前仍面临亏损和市场份额低的问题。

谷歌与SpaceX达成3年AI算力合作 谷歌将每月支付9.2亿美元使用孟菲斯C1数据中心

蓝点网
蓝点网 · 2026-06-06T04:58:00Z
有人靠CPU把AI算力密度卷到了新高度

英特尔推出新技术以应对Agentic AI的算力焦虑,提升AI算力密度,推动数据中心和AI的发展。

有人靠CPU把AI算力密度卷到了新高度

量子位
量子位 · 2026-06-05T13:16:53Z
如何降低AI对话开发成本及部署AI对话开发应用?

AI对话项目在规模化运营后,成本控制成为关键。主要成本包括算力、带宽、服务器和数据迭代。优化路径包括利用成熟平台、模型分级调度、资源优化和建立成本监控体系。部署方式有公有云、私有化和混合部署,需权衡安全、成本和弹性。稳定性保障至关重要,需做好监控和容灾备份。合理设计成本结构,借助专业平台合作,有助于实现可持续运营。

如何降低AI对话开发成本及部署AI对话开发应用?

实时互动网
实时互动网 · 2026-06-05T06:50:46Z
科技爱好者周刊(第 399 期):中国 AI 大厂访问记

今年5月,美国访问团考察了14家中国AI和机器人公司,发现中国在算力方面受限于美国的芯片出口管制,导致研发进展缓慢。尽管中国公司在效率上有所提升,但整体算力仍落后于美国。中国AI市场对开源模型存在分歧,部分公司倾向于将大模型托管在云端而非开源。年轻研究人员对AGI持开放态度,认为安全问题应由政府解决。中国企业对AI服务的需求正在向云计算转变。

科技爱好者周刊(第 399 期):中国 AI 大厂访问记

阮一峰的网络日志
阮一峰的网络日志 · 2026-06-05T00:07:45Z
英博数科亮相CCIG 2026,首次公开EBFlex私有化算力管理平台

2026年中国图象图形大会将在广州举行,重点关注图象图形与人工智能等前沿技术。英博数科展示了EBFlex私有化算力管理平台,旨在提升高校科研算力的供给与管理效率。该平台支持统一管理本地GPU资源,并与EBCloud公有云服务协同,解决算力高峰问题,推动高校科研算力的服务化与平台化发展。

英博数科亮相CCIG 2026,首次公开EBFlex私有化算力管理平台

量子位
量子位 · 2026-06-04T07:25:26Z

KeyCompute 是一个 AI Token 算力服务平台,旨在帮助中小企业和开发者管理多模型混用、账号池和计费等复杂链路。该平台使用 Rust 语言构建,提供双层路由引擎、实时计费和闲置算力接入等功能,确保高效、可扩展的基础设施,并采用清晰的架构设计,强调依赖单向性和可选依赖,避免并发和精度问题。

构建新一代 AI Token 算力服务平台:KeyCompute 技术架构剖析

Rust.cc
Rust.cc · 2026-06-04T03:30:44Z
微软发布Surface RTX SPARK开发工作站 利用英伟达芯片提供本地AI算力

微软推出了 Microsoft Surface RTX SPARK 开发工作站,搭载英伟达芯片,支持本地运行 AI 模型。该工作站配备 20 核心 CPU 和 6144 CUDA 核心的 GPU,内存为 128GB,外壳采用阳极氧化铝,设有1000个散热孔,确保高负荷下保持凉爽。预计将于今年晚些时候在美国市场发布。

微软发布Surface RTX SPARK开发工作站 利用英伟达芯片提供本地AI算力

蓝点网
蓝点网 · 2026-06-03T04:30:38Z
Alphabet官宣800亿美元天量融资,重金押注AI基建与算力

谷歌母公司Alphabet宣布融资800亿美元,主要用于人工智能基础设施和算力建设。融资方式包括公开发行300亿美元、按市值发行400亿美元及伯克希尔·哈撒韦注资100亿美元。这一举措显示了Alphabet在AI领域的扩张决心,背后是云服务业务的快速增长。

Alphabet官宣800亿美元天量融资,重金押注AI基建与算力

TechWeb 全站精华
TechWeb 全站精华 · 2026-06-02T02:23:42Z

英伟达推出RTX SPARK超级芯片,结合ARM CPU和NVIDIA GPU,提供最高1 peta FLOP算力,支持本地AI模型运行。该芯片采用统一内存封装,适合创作者和游戏玩家,搭载该芯片的笔记本将于秋季上市,主要面向高端市场。

英伟达推出高端PC处理器RTX SPARK 提供1petaFLOP算力和最高128GB内存

蓝点网
蓝点网 · 2026-06-01T07:32:50Z
英伟达掀桌,Windows 终于迎来真 AI PC

英伟达在2026年COMPUTEX上推出RTX Spark处理器,旨在将个人电脑转变为AI平台。该处理器结合强大GPU和定制CPU,支持创作和游戏等多种应用场景。英伟达强调未来PC将成为AI智能体的核心,推动软件开发和生产力提升,并展示了AI工厂的构建蓝图,突显算力的重要性和商业逻辑的转变。

英伟达掀桌,Windows 终于迎来真 AI PC

爱范儿
爱范儿 · 2026-06-01T06:53:35Z
Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

在2026中国AIGC产业峰会上,亚马逊云科技的王晓野指出,虽然87%的企业声称已部署AI,但真正获益的仅有10%。他强调企业在实施AI Agent时面临模型选择、系统稳定性和人才缺口等挑战,并建议关注算力、模型、数据平台等五大能力,以实现AI的有效应用和价值提升。

Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

量子位
量子位 · 2026-06-01T05:32:24Z
Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

在2026中国AIGC产业峰会上,亚马逊云科技的王晓野指出,87%的企业已部署AI,但仅10%获得实际价值。他强调企业需解决模型选择、算力和数据安全等问题,以实现AI Agent的稳定运行。他提出五大能力,包括算力、模型、数据平台、Agent平台和应用,帮助企业从Demo转向生产,推动AI Agent的落地。

Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

量子位
量子位 · 2026-05-31T10:03:40Z
4nm!比亚迪自研AI芯片来了:制程对齐英伟达,算力拉爆特斯拉

比亚迪推出了中国首款车规级4纳米智驾芯片璇玑A3,具备超过2100 TOPS的算力,功耗比同类产品低20%。该芯片专为AI推理设计,提升算力利用率100%,并支持低延迟数据调度。比亚迪承诺在城市领航期间,因辅助驾驶导致的事故将全额赔偿,标志着中国车企在高端智驾芯片领域的突破。

4nm!比亚迪自研AI芯片来了:制程对齐英伟达,算力拉爆特斯拉

量子位
量子位 · 2026-05-29T14:30:20Z
清华系团队给大模型织了一张“智能算力电网”

是石科技成立于2021年,专注于通过并行优化技术提升国产AI算力效率,构建标准化、低成本的Token生产能力,解决算力资源碎片化问题。公司整合多种算力资源,优化推理过程,降低Token生产成本,提升吞吐量,推动中国AI产业的规模化和高质量发展。

清华系团队给大模型织了一张“智能算力电网”

量子位
量子位 · 2026-05-29T02:47:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码