小红花·文摘 - 小红花技术领袖俱乐部

在高流量大型语言模型应用中构建推理缓存以节省成本

在高流量大型语言模型应用中构建推理缓存以节省成本

MachineLearningMastery.com ·

本研究提出了一种新的$ ext{ε}$-先进颜色传递（$ ext{ε}$-ACP）算法，旨在解决现有算法在识别不可区分对象时的精确匹配问题。该算法通过允许潜在值的偏差，有效利用不完全匹配的不可区分性，实验结果表明其近似误差接近零，展现了实际应用潜力。

Approximate Lifted Model Construction

BriefGPT - AI 论文速递 ·

该文介绍了一种新型的提取攻击——Model Leeching，可以从大型语言模型中提取特定任务知识到一个减少参数的模型。作者通过从ChatGPT-3.5-Turbo中提取任务能力来证明攻击的有效性，精确匹配相似度达到73%。

模型吸附攻击：针对 LLMs 的提取攻击

BriefGPT - AI 论文速递 ·