华盛顿大学研究者开发了LLMc,一种基于大型语言模型的无损文本压缩引擎,其压缩率优于传统工具。LLMc采用概率预测和排序编码方法,有效压缩文本,但在处理速度和应用范围上仍面临挑战。
本文研究了支持向量机(SVM)在预测中的不确定性量化,提出了稀疏支持向量分位回归(SSVQR)模型,以提高预测区间的质量,并通过特征选择减少高维数据集中的特征数量。实验结果表明,SVM在概率预测任务中优于现代深度学习模型。
本研究探讨了二元分类评估的不足,提出从结果主义角度评估概率预测的有效性,并提出了一种新评估框架,推广Brier分数的使用,以解决临床评分规则的有效性问题。
本研究探讨了非地面网络中高效资源管理的挑战,采用概率预测方法分析资源分配,克服了传统预测的局限性。结果表明,几何概率预测模型能够有效优化资源分配,并提出了集成地面与非地面网络的应用场景和标准化路线图。
大型语言模型(LLM)如DeepSeek和GPT比文本自动纠错机制更复杂。它们基于N-gram模型,通过概率预测下一个单词,分解文本为词对并计算频率。分词方法包括空格分词和字节对编码(BPE),后者通过字符频率构建词汇,减少词汇量并识别未知术语。现代LLM采用更复杂的策略,超出本文讨论范围。
大型语言模型在推理上有局限性,尽管能生成连贯回复,但复杂推理任务易出错。这是因为模型基于概率预测而非确定性逻辑。研究者尝试通过思维链提示、自我批判机制和外部工具提升推理能力,但各有挑战。模型计算能力有限,需谨慎对待其输出。
本文研究了概率预测模型的校准方法,提出了直方图分箱、概率校准树和简化校准方法等技术,以提高分类器的准确性和可靠性。研究表明,这些方法在不同场景下有效降低校准误差,尤其适用于高风险决策中的概率估计。
本文探讨了支持向量机、深度学习和新兴概率预测方法在风能和光伏发电预测中的应用,研究表明这些方法能有效提高预测准确性,优化电力市场参与策略,并解决分位数交叉问题。
本文研究了多种评分规则在概率预测模型中的应用,发现对数评分规则在高不确定性下表现优越,而球形评分规则在低不确定性下更佳。同时,提出了排序概率得分(RPS)作为医学图像分级的性能指标,并探讨了偏标记学习策略及其鲁棒性,提出了新颖的部分标签学习框架以应对大规模数据的计算复杂度。
该论文介绍了一种整合了确定性和概率方法的天气预报模型,名为DGDM。通过训练确定性模型和概率模型,并利用确定性模型的预测结果作为概率模型的起始点,DGDM在全球和区域预测方面取得了准确且先进的结果。
该文介绍了一种新的自主系统多阶段概率预测路径的方法,使用深度特征聚类方法进行分布偏移,使用基于距离的排序建议进行轨迹生成和分配概率,相比传统方法更有效准确。
本研究提出了一种通过不确定性感知框架来推广预测的方法,能够减少传感器部署数量,生成包含不确定性量化的概率预测,以助于风险管理和决策制定。实验结果表明该方法在预测任务上取得了有希望的结果,并且不确定性量化结果与有和无历史数据的位置高度相关。同时,该模型能够在交通领域的传感器部署任务中,以有限的传感器部署预算实现更高的准确性。
完成下面两步后,将自动完成登录并继续当前操作。