白山云科技推出“大模型API”,提供多款低延时、稳定的API服务,降低AI应用成本。通过边缘推理,支持高实时性和高性价比场景,推动“云-边-端”协同智能,助力企业智能化转型。
本研究提出了一种基于拍卖的边缘推理定价机制(AERIA),有效解决了深度神经网络推理服务的个性化需求与收益激励之间的矛盾。实验结果表明,AERIA在收益最大化方面显著优于其他方法。
本研究提出了优化推理系统Bitnet.cpp,解决了三元大型语言模型在边缘推理中的效率问题。该系统采用新型混合精度矩阵乘法库,实现了高效无损推理,速度比全精度快6.25倍,推动了该领域的发展。
本文提出了一种早期预测机制 'Exit Predictor',通过引导某些明显 '困难' 的数据样本绕过早期出口的计算,降低设备边缘混合推理系统中早期退出网络的计算负担。同时,通过回归模型调整预测阈值和置信度阈值,适应不同带宽条件下的推理需求。实验结果表明,Exit Predictor 在准确性和设备计算负担之间取得更好的折衷效果。
完成下面两步后,将自动完成登录并继续当前操作。