最小通信成本的统计学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了分布在多个机器上的数据的非参数平滑函数估计问题。研究结果显示,在不同的设置下,统计风险的渐近下限和匹配上限有所不同。当通信预算很小时,统计风险仅取决于通信瓶颈,而与样本量无关。在通信预算很大的情况下,与非分布式估计的经典极小风险相同。在一种中间机制中,统计风险取决于样本大小和通信预算。

🎯

关键要点

  • 研究了分布在多个机器上的数据的非参数平滑函数估计问题。
  • 每个机器上收集了来自白噪声模型的独立样本。
  • 需要在中央机器上构建潜在真实函数的估计值。
  • 限制了传输信息所需的比特数。
  • 给出了统计风险的渐近下限和匹配上限。
  • 确定了通信预算、机器数和每台机器上可用数据大小的三个区别。
  • 当通信预算很小时,统计风险仅取决于通信瓶颈,与样本量无关。
  • 在通信预算很大的情况下,统计风险与非分布式估计的经典极小风险相同。
  • 在中间机制中,统计风险取决于样本大小和通信预算。
➡️

继续阅读