本文探讨了重用预训练数据在测试中的有效性。研究表明,通过检索增强生成和测试时计算,模型在MMLU、Math-500和SimpleQA等任务上的准确性显著提高。在MMLU上,预训练结合检索的方式实现了约5倍的计算增益,进一步的测试时计算可提升10个百分点。这表明当前预训练方法未充分利用现有数据集的信息,仍有改进空间。
移远通信推出YECN029JBAM 5G透明吸顶室内分布天线,支持700MHz至6000MHz频段,兼容2G、3G、LTE及5G NR,天线效率达90.8%,峰值增益5.5dBi,提供360°均匀覆盖,适应-30℃至+70℃环境,广泛应用于智慧办公、智能家居和交通枢纽。
2025年腾讯全球数字生态大会将于9月16-17日在深圳举行,主题为“智·向远大”,旨在探讨智能重构与全球机遇,助力企业可持续增长,是产业互联网的重要盛会。
本研究解决了指令调整数据集中的数据质量和多样性不足的问题,尤其是在海量开放源代码数据集中。我们提出了一种统一的方法,通过构建标签图量化数据集的信息内容,并基于此引入有效的采样方法来最大化语义空间中的信息增益(MIG),实验结果显示该方法优于现有最先进的方法,显著提升了模型的性能。
本研究提出了一种基于扩散信息增益的动态图像融合框架,解决了现有方法无法动态捕捉多模态重要性的问题。实验结果表明,该方法在融合质量和推理效率上优于现有技术。
HDR视频技术已广泛应用于电影和手机拍摄,但HDR照片标准直到2023年才由Adobe和Apple联合发布。HDR相比SDR能保留更丰富的亮度细节,ISO HDR标准允许更高位数存储图像数据,提升图像质量。增益图HDR技术通过记录SDR图像及其与HDR的亮度差异,减少文件大小并提高兼容性。
合成数据在大语言模型后训练中因高质量数据稀缺而重要。本文通过数学建模提出“逆信息瓶颈”视角,强调信息增益对模型泛化能力的作用。研究显示,合成数据不仅缓解数据不足,还提升任务相关信息和对齐精度。模拟实验验证了合成数据生成与模型泛化能力的关系,为未来优化提供理论基础。
本研究提出TIGER模型,通过时间-频率交错提升低延迟语音处理效率。TIGER大幅减少参数和计算成本,并使用新数据集EchoSet评估复杂声学环境下的表现。实验表明,TIGER在减少94.3%参数和95.3%计算量的情况下,性能优于现有最佳模型,具有巨大应用潜力。
本文介绍了一种基于经验的隐私防御方案,旨在保护训练数据隐私而不降低模型效用。通过对比数据可用性和隐私处理,设计了一种基线防御方法,能够评估和比较模型效用、训练数据隐私和参考数据隐私。实验结果表明,该方法在相对隐私水平上优于当前最先进的方法,同时揭示了现有方法在权衡模型效用、训练数据隐私和参考数据隐私方面的问题。强调了比较隐私防御方法时需要适当评估这些因素。
本论文提出了Dynamic Bayesian Incentive-Compatible Recommendation Protocol (DBICRP)来解决推荐系统设计的挑战,并介绍了基于两阶段算法(RCB)的方法,以实现亚线性遗憾和贝叶斯激励兼容。通过模拟和实际应用验证了RCB算法的强激励增益、亚线性遗憾和鲁棒性。
本文介绍了一个由1100个可控元素组成的5.8 GHz带宽的新型可重构智能表面(RIS)原型。通过无线配置算法,RIS原型在室内测试中提供了26 dB的增益,在短距离室外测试中提供了27 dB的增益。长距离测试中成功传输了32 Mbps数据流,并且利用RIS时能流畅播放1080p视频。RIS是未来无线通信的前景技术。
该论文提出了一种新的方法,通过引入基于1/√t的修改衰减步长来提高随机梯度下降(SGD)算法的性能。实验结果显示,与传统的1/√t步长相比,准确率明显提高,分别观察到0.5%和1.4%的增益。
该研究创建了最大的跨语言翻译数据语料库,包含超过450k个样例,覆盖了1.8k种语言。通过预训练和微调模型,证明了跨语言转移对于资源稀缺的语言的有效性。
研究人员通过信息增益最大化启发式方法开发了一种增强的主动学习方法,并在真实环境中评估了其有效性。研究发现,高技能的分析员提供标签,并使用置信度评分来估计分析员的标签不确定性,并根据预期信息增益的优先级对实例进行标记是最佳的评估方法。研究还建议在实施主动学习之前对分析员进行筛选和培训,并在早期阶段使用基于专家置信度的信息增益最大化采样方法。
研究着重探讨开放词汇对象检测 (OVOD) 中的问题,包括对新类别的检测性能不佳以及候选区域和对象分类阶段的局限性,并提出了一种后处理方案(AggDet),通过两种先进的衡量方法来调整信心分数和恢复误判的对象,并在 OV-COCO 和 OV-LVIS 基准上取得了显著的性能提升。
本文使用强化学习技术调整四旋翼控制器的控制增益,采用近端策略优化训练一个根据实际情况调整控制增益的策略。结果显示,自适应增益方案实现了超过40%的跟踪误差降低。
设计电路时需注意选择合适的增益和增益电阻,减小杂散电容影响,避免驱动大电容负载。使用示波器观察输出波形时注意电缆线输入电容可能导致振荡,可通过串联隔直电阻解决。
通过引入编码在干预一个变量时另一个变量熵的变化的量,最近的研究实现了给定结构因果模型(SCM)的因果控制的量化。我们的研究通过建立和分析这些概念的基本性质,包括界限和链规则,对因果熵和因果信息增益的概念的形式理解做出了贡献。此外,我们阐明了因果熵与随机干预之间的关系,并提出了因果条件熵和因果条件信息增益的定义。总体而言,这种探索为通过研究最近提出的在因果性考虑方面扎根的信息论量来增强因果机器...
本文研究了移动机器人自主探索和检查的问题,提出了一种新的数据驱动的模仿学习框架,并通过EXPLORE算法训练了一个策略,以模仿一个有完整信息的先知来最大化获取信息的能力。验证了该方法在不同对象分布上的适应能力。
基于离线数据的强化学习预训练改进的模型数据增强策略,可以减少所需数据规模,并大幅提高在线微调效果和降低环境交互次数。
完成下面两步后,将自动完成登录并继续当前操作。