小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
超低延时重构AI推理体验!白山云发布“大模型API”产品

白山云科技推出“大模型API”,提供多款低延时、稳定的API服务,降低AI应用成本。通过边缘推理,支持高实时性和高性价比场景,推动“云-边-端”协同智能,助力企业智能化转型。

超低延时重构AI推理体验!白山云发布“大模型API”产品

实时互动网
实时互动网 · 2025-07-02T02:30:38Z

本研究提出了一种基于拍卖的边缘推理定价机制(AERIA),有效解决了深度神经网络推理服务的个性化需求与收益激励之间的矛盾。实验结果表明,AERIA在收益最大化方面显著优于其他方法。

Dynamic Pricing of On-Demand Deep Neural Network Inference in the Edge Artificial Intelligence Market

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究提出了优化推理系统Bitnet.cpp,解决了三元大型语言模型在边缘推理中的效率问题。该系统采用新型混合精度矩阵乘法库,实现了高效无损推理,速度比全精度快6.25倍,推动了该领域的发展。

Bitnet.cpp: Efficient Edge Inference for Ternary Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本文提出了一种早期预测机制 'Exit Predictor',通过引导某些明显 '困难' 的数据样本绕过早期出口的计算,降低设备边缘混合推理系统中早期退出网络的计算负担。同时,通过回归模型调整预测阈值和置信度阈值,适应不同带宽条件下的推理需求。实验结果表明,Exit Predictor 在准确性和设备计算负担之间取得更好的折衷效果。

加速推理与减少遗忘:早退出网络在持续学习中的双重好处

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-12T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码