小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI行业的盈利竞赛已变得生死攸关

AI行业面临盈利压力,Anthropic和OpenAI需在2026年前实现盈利。两家公司因AI代理的高计算需求而做出艰难决策,影响产品支持和用户计划。

AI行业的盈利竞赛已变得生死攸关

The Verge
The Verge · 2026-04-09T14:00:00Z
人工智能基础设施:核心组件与最佳实践

随着人工智能(AI)应用的加速,组织面临实施AI基础设施的压力。AI基础设施包括支持AI和机器学习的硬件、软件、网络和存储系统,传统IT基础设施无法满足其高计算需求。核心组件如GPU、TPU和存储管理确保高效的数据处理。AI基础设施可在云端、本地或混合模式下部署,需根据组织目标和预算选择合适方案。

人工智能基础设施:核心组件与最佳实践

Databricks
Databricks · 2026-01-20T05:20:00Z
为人工智能做好未来准备:重蹈覆辙还是吸取教训?

硅谷科技巨头计划在2025年投资3200亿美元于AI基础设施,其中亚马逊将支出1000亿美元,微软、谷歌和Meta的投资将增加30%。历史经验表明,快速创新可能带来安全隐患和资源浪费,因此AI基础设施建设需兼顾安全与效率,以应对日益增长的计算需求和安全挑战。

为人工智能做好未来准备:重蹈覆辙还是吸取教训?

The New Stack
The New Stack · 2025-06-03T14:00:56Z

本研究提出FL-LLaMA框架,旨在解决大语言模型在联合环境中的数据隐私和计算需求问题。通过引入高斯噪声和并行训练策略,FL-LLaMA提升了安全性与效率,并支持动态调整数据分区点。实验结果显示,FL-LLaMA在性能上与集中式LLaMA2相当,且训练和推理速度显著提升。

A Federated Splitting Framework for Large Language Models: Security, Efficiency, and Adaptability

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本文探讨了高效世界模型在AI代理评估中的重要性,指出计算需求对模型的限制。提出了一种新方法,通过计算力学简化世界模型,揭示效率与可解释性之间的权衡,为提升AI代理评估的效率和可靠性提供指导。

AI in a Vat: Fundamental Limits of Efficient World Modeling for Agent Sandboxing and Interpretability

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z

本文提出了一种“领域引导”方法,旨在解决个性化扩散模型的高计算需求和低扩展性问题。实验结果显示,该方法在多个迁移基准上表现优异,FID指标提升19.6%,FD$_ ext{DINOv2}$指标提升23.4%。

Domain Guidance: A Simple Transfer Method for Pre-trained Diffusion Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究利用Unity生成多层次地形抽象,解决了多智能体强化学习在军事训练模拟中的高计算需求,提升学习效率,降低开发成本。

Geographically Specific Terrain Abstraction for Enhanced Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-25T00:00:00Z
在DeepSeek之后,NVIDIA在GTC大会上将重点放在推理上

今年,DeepSeek开发的高效推理模型导致NVIDIA股价下跌。CEO黄仁勋在GTC大会上强调未来应用将依赖AI,预计AI计算需求将增长100倍,并推出新硬件和软件,助力企业建立“AI工厂”。此外,NVIDIA还发布了优化推理速度的新模型Llama Nemotron。

在DeepSeek之后,NVIDIA在GTC大会上将重点放在推理上

The New Stack
The New Stack · 2025-03-18T23:30:20Z

本研究提出一种新方法,通过可变时间步长和预测时间范围,优化多旋翼无人机拦截动态目标的计算需求,提高轨迹生成质量,支持长时间飞行计划。

变步长模型预测控制在灵活多旋翼无人机拦截动态目标中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了TaylorSeer方法,以解决扩散变换器的高计算需求问题。该方法通过泰勒级数近似特征高阶导数,显著提升了图像和视频合成的效率,尤其在高加速比下实现了近乎无损的加速效果。

From Reuse to Prediction: Accelerating Diffusion Models with TaylorSeer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z
快速语言人工智能突破:新模型一次性生成文本,质量媲美顺序系统

研究提出大型语言扩散模型(LLDMs),作为自回归模型的替代方案。该模型结合扩散模型与语言建模,实现并行文本生成,降低计算需求,并在质量指标上与自回归模型相当。

快速语言人工智能突破:新模型一次性生成文本,质量媲美顺序系统

DEV Community
DEV Community · 2025-02-19T10:27:20Z

本研究提出了一种基于知识蒸馏的脉冲神经网络集成系统,旨在解决传统人工智能模型在能源受限应用中的高能耗问题。该系统通过自适应激活策略显著提高了能效,减少了计算需求,并在CIFAR-10数据集上仅有2%的准确率下降,展示了新的可行方向。

Dynamic Activation Strategies Based on Knowledge Distillation for Energy-Efficient Spiking Neural Network Ensembles

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z
中国DeepSeek AI正在打击Nvidia的痛点

中国初创公司DeepSeek的AI聊天机器人在美国苹果应用商店迅速崛起,超越了OpenAI的ChatGPT。DeepSeek声称其AI模型在成本和计算需求上低于行业领先者,最新发布的R1推理模型在某些基准测试中表现与OpenAI的模型相当。这一成功引发了对传统AI公司计算密集型方法的质疑。

中国DeepSeek AI正在打击Nvidia的痛点

The Verge
The Verge · 2025-01-27T12:49:01Z

本研究提出了一种高效推导编程语言特定子模型的方法,通过无结构修剪技术降低大型语言模型的计算需求。研究表明,适当的校准数据集能够有效提取子模型,同时保持准确性,增强其在编程任务中的可及性。

Deriving Coding-Specific Sub-Models from Large Language Models using Resource-Efficient Pruning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出快速提示对齐(FPA)框架,旨在解决复杂文本提示与生成视觉对齐的问题,提高对齐效率,降低计算需求,并展示实时推断的应用潜力。

Fast Prompt Alignment for Text-to-Image Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z
Hertz-Dev:用于实时对话式 AI 的开源 8.5B 音频模型,在单 RTX 4090 上具有 80 毫秒理论延迟

Standard Intelligence Lab发布了Hertz-Dev,一个开源的85亿参数音频模型,理论延迟为80毫秒,实际延迟为120毫秒,旨在提升实时交互性能。该模型降低了计算需求,适合独立开发者和小型企业,推动AI技术的普及,广泛应用于客户服务和智能家居等领域。

Hertz-Dev:用于实时对话式 AI 的开源 8.5B 音频模型,在单 RTX 4090 上具有 80 毫秒理论延迟

实时互动网
实时互动网 · 2024-11-06T03:52:38Z

本研究提出了一种光学编码器,解决了传统神经网络在图像处理中的高计算需求。该编码器在三个颜色通道中同时进行卷积,计算操作减少约24,000倍,分类准确率达到73.2%。它能够无缝迁移至不同数据集,展示了光学计算机视觉系统的潜力。

Transferable Multicolor Optical Encoder for Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z
小规模大语言模型训练中的计算瓶颈

本文分析了小规模大语言模型(SLMs)训练中的瓶颈,探讨了超参数和配置(如GPU类型、批量大小等)对计算需求的影响,旨在帮助低资源AI研究机构优化语言模型训练。

小规模大语言模型训练中的计算瓶颈

Apple Machine Learning Research
Apple Machine Learning Research · 2024-10-29T00:00:00Z

本研究提出了MiniPLM框架,解决了预训练语言模型知识蒸馏的效率与有效性问题。通过优化训练数据分布,显著提升了学生模型在多个任务上的性能,并降低了计算需求。

MiniPLM: Knowledge Distillation for Pre-trained Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z
计算优化采样:小型语言模型在推理任务中胜过大型模型

这篇文章介绍了一种名为“计算优化采样”的新训练方法,可以提高大型语言模型(LLMs)的推理能力,同时减小模型大小和计算需求。研究表明,这种方法可以在一系列推理任务上比较大且更强大的模型表现更好。文章认为,计算优化采样是一种有前景的技术,可以开发更高效和能力更强的人工智能系统。

计算优化采样:小型语言模型在推理任务中胜过大型模型

DEV Community
DEV Community · 2024-09-03T06:26:32Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码