小红花·文摘

本研究解决了癌症诊断中数据不平衡带来的分类器性能和可靠性问题，提出了RE-SMOTEBoost方法。该方法通过优先在重叠区域生成合成样本、信息熵过滤机制减少噪声并引入双重正则化惩罚，有效提高了少数类样本的质量。结果表明，RE-SMOTEBoost在不平衡数据集上相较于现有技术有显著提升，证明了其在医疗应用中的潜在影响。

一种基于信息熵和轮盘选择的新型双重剪枝方法用于乳腺癌诊断的不平衡数据

BriefGPT - AI 论文速递 ·

本研究解决了大型语言模型在自然语言处理中的长度外推能力不足的问题。通过引入基于信息熵不变性的创新方法，提出了两种新的缩放温度：InfoScale和CosScale，显著提升了长度外推性能并达到了最新的研究水平。实验结果显示，该方法在GAU-α模型上实现了超越七种现有方法的表现，有助于改善长范围上下文处理中的注意力得分稀释问题。

信息熵不变性：增强注意力机制中的长度外推

BriefGPT - AI 论文速递 ·

本文介绍了一种基于最大值熵搜索的多保真度贝叶斯优化方法（MF-MES），该方法通过熵的考虑简化了计算，并解决了信息熵估计问题。同时，文章提出了MF-MES的并行化方案，并通过实验验证了其在材料科学等领域的有效性。

信息匹配方法在最优实验设计和主动学习中的应用

BriefGPT - AI 论文速递 ·

本文介绍了一种基于马尔科夫链的文本隐写术，提出了多种改进的编码算法，如patient-Huffman和ADG，以提升隐蔽性和安全性。实验结果表明，这些方法在统计隐蔽性和文本质量上优于现有技术，适用于信息隐藏和自然语言处理等领域。

ADLM -- stega：一种通用自适应令牌选择算法，通过信息熵改善隐写文本质量

BriefGPT - AI 论文速递 ·

本研究提出了一种基于3D-CNN的图像压缩方法，通过建模隐层表示的熵，优化重构误差与信息熵的平衡。引入自回归和层次先验，显著提升了压缩效果，并探讨了并行上下文模型和Transformer-CNN混合块，进一步提高了解码速度和压缩性能。

用于学习图像压缩的因果上下文调整损失

BriefGPT - AI 论文速递 ·

.m | Bayesian 贝叶斯，从公式到世界观

阿掖山：一个博客 ·

本文研究了元音和谐，采用数据驱动的计算建模方法，利用信息熵度量元音的可预测性，发现神经语言模型能够捕捉多语言中的元音和谐模式。此外，词列表被视为语言类型学研究的重要资源，为低资源语言的研究提供了新的可能性。

建模多变量重叠：一种衡量元音合并的方法

BriefGPT - AI 论文速递 ·

该研究提出了一种信息熵方法，用于量化多模态分布中输入特征的冗余和协同作用，帮助模型选择和应用。通过部分信息分解，分析了摘要特征与源文件数量的关系，并引入“表征复杂度”概念，测量神经网络信息表达的难度。此外，研究了多元表示的分离度量及其在纠缠反应中的应用，探讨了联邦学习中的公平性问题，提供了动态特征选择的新方法。

数据解释性和特征选择的部分信息分解

BriefGPT - AI 论文速递 ·

本文讨论了信息和概率的关系，介绍了信息论中的自信息、信息熵、相对熵和互信息等概念，以及与之相关的Python函数。最后，通过阿提拉和狄奥多里克的故事，说明了算命的魅力和信息熵的差价。

.tex | 比较两个概率分布/两条信息

阿掖山：一个博客 ·

本文提出了一种自适应水印策略，旨在提高大型语言模型生成文本的安全性和可识别性。通过多目标优化方法，研究了在文本中嵌入水印的新技术，确保语义连贯性。该框架能够有效检测水印，防止模型滥用，并在代码生成任务中表现优异，同时扩展了水印设计空间，采用深度学习技术实现高质量文本来源检测。

基于信息熵的文本水印检测方法

BriefGPT - AI 论文速递 ·

本研究提出了一种自适应解码方法，称为上下文信息熵约束解码（COIECD），以解决知识冲突。实验表明，COIECD 在现实数据集中表现出较强的性能和鲁棒性。

通过上下文信息熵约束的自适应解码来辨别和解决知识冲突

BriefGPT - AI 论文速递 ·

本文介绍了一种采用可计算的信息理论模型的深度学习模型，并探讨了该模型从统计物理方法中导出熵和互信息的方法。同时，设计了一种实验框架用于对生成模型进行训练，并对该模型进行验证。

信息熵损失对生成式语言模型学习困难的缓解

BriefGPT - AI 论文速递 ·

该研究提出了E-Sparse修剪度量设计，利用信息熵提高大型语言模型的稀疏性准确性，快速优化信息分布和节省内存。实验结果表明，E-Sparse可以显著加速模型推理，同时实现内存节省。

E-Sparse: 通过基于熵的 N:M 稀疏性提升大型语言模型推理

BriefGPT - AI 论文速递 ·

该研究提出了一种自条件嵌入扩散机制，可用于条件和非条件文本生成。该模型能够学习灵活和可扩展的扩散模型，生成的样本与标准自回归语言模型相当，且推断时间更高效。该研究为文本扩散模型的规模扩大和性能提高铺平了道路。

信息扩散：对非自回归文本生成的信息熵感知扩散过程

BriefGPT - AI 论文速递 ·

本文介绍了一种采用可计算信息理论模型的深度学习模型，并探讨了该模型从统计物理方法中导出熵和互信息的方法。同时，设计了一种实验框架用于对生成模型进行训练，并对该模型进行验证。

探究学习系统中信息熵变化的影响

BriefGPT - AI 论文速递 ·

【3.0】决策树

Seraphineの小窝 ·

【阅读时间】10min - 13min【内容简介】使用一个现实中直观的例子详解信息熵、交叉熵及相对熵的核心概念，读完后，希望能帮助你建立起这三个概念的固有直觉，不再疑惑要完成题目的最终解释，必须从熵这个神奇的概念开始讲起

【直观详解】信息熵、交叉熵和相对熵

遥行 Gofurther 技术&ML&BC博客 ·

贝尔实验室和MIT有很多人将香农和爱因斯坦相提并论，而其他人则认为这种对比是不公平的，对香农不公平 – 威廉·庞德斯通这两天晚上在看熵相关的知识

热力学熵与信息熵

夜行人 ·