文章讨论了实体链接中的大型语言模型应用,提出了ARTER方法,通过候选生成、上下文评分和选择性推理提升性能,无需深度微调。ARTER在标准基准测试中优于ReFinED,并提高了LLM令牌的使用效率。
本研究解决了视觉语言模型在特定任务上的表现不足问题,尤其是Llava-1.5在图表和图解理解方面由于缺乏任务特定训练数据而存在的局限。通过引入MM-Gen方法,研究者能够生成高质量的任务特定合成文本,使得对模型的微调显著提升了任务性能。其中,Llava-1.5在空间推理和图表理解方面的性能提升分别达到了29%和15%。
本研究提出了一种物理指导的强化学习框架(PG-RL),旨在提升电网的韧性。研究结果表明,PG-RL提高了资源利用效率,并改善了应对停电的策略,对应对气候变化具有重要意义。
研究表明,类别间距离减小时,鲁棒公平性会恶化。为此,提出了“距离感知的公平对抗训练(DAFA)”方法,通过调整损失权重和对抗边界来改善鲁棒公平性。实验结果表明,该方法在鲁棒准确性方面优于现有方法。
落地页是销售员,卖结果。制作时要站在用户角度思考,满足需求。高转化落地页要有针对性、突出使用效果、互动有好处、优惠有时效性。
自然语言处理和大型语言模型取得进展,但存在幻觉问题。研究发现FLAN-T5-11B作为事实验证器表现最佳,超过GPT3.5和ChatGPT。研究为开发可信赖的生成模型提供见解。
本文旨在提高有针对性攻击中对抗样本的可转移性,通过在损失和特征方面提出两种不同的改进方法。首先,我们引入了一种新的规范化对数准确度校准方法,它同时考虑了对数边界和对数的标准差。其次,我们进一步研究了截断特征混合方法来减小源训练模型的影响,从而实现了额外的改进。在 ImageNet-Compatible 和 CIFAR-10...
基于分子结构预测和增强固有性质对于医学、材料科学和环境管理中的设计任务至关重要,本研究介绍了一种主动学习方法,通过智能抽样和干预来辨识潜在的因果关系,以优化在未接触到的化学空间内的设计任务。
标准性能评估公司SPEC撤销了2600多项测试结果,因为发现英特尔针对SPEC标准进行了作弊。英特尔使用了专门针对某些基准测试的编译器,使测试结果夸大了9%。这主要影响工业和教育客户。这种作弊行为在移动平台和安全行业也不罕见。
在这篇论文中,通过在特征空间进行微调,我们提出了一种解决针对未知模型的有针对性对抗样本(AE)传递性问题的方法,实验证明简单的迭代攻击可以产生与资源密集型方法相媲美甚至更好的传递效果。
这篇论文提出了一种新的有针对性攻击方法,通过最小化雅可比诱导的马氏距离来实现。该方法在多种输出编码方案下都有效,且在多标签分类场景中表现良好。此外,该攻击方法迭代次数少,更高效。
Matrix是一个主张分享真实产品体验和经验思考的少数派写作社区。体检对于早期癌症发现和了解身体风险很有用。选择合适的体检项目和关注异常项很重要。利用AI模型可以帮助选择体检项目。根据个人情况选择体检套餐,预算高的可以定制,预算正常的可以在体检中心进行,预算低的可以关注高风险疾病。体检报告异常项可以使用AI模型给出建议,重点关注需要专科门诊问诊的异常项。
深度生成模型在数据密度估计和有限样本数据生成方面取得巨大成功。结构因果模型融入深度生成建模以解决其缺点,描述数据生成过程并建模变量之间的因果关系。因果生成模型应用于公平性、隐私、超出分布泛化和精准医学。该领域仍有未解决的问题和未来研究方向。
该文介绍了一种新型全面主动防御机制 Dual Defense,通过将水印隐式嵌入目标人脸,有效应对恶意人脸交换而引起的安全威胁,保持水印信息的完整性,并具备优异的对抗性和可追踪性。
该研究提出了一种基于文本的视觉与语言模型训练方法,通过从大型语言模型中采样文本数据来提高视觉识别性能。实验结果表明,该方法在交领域特定适应、精细化识别和零标记分类方面均有显著提高。
本文研究了语言模型计算的内部结构,发现了适应性计算形式和后期 MLP 层的反平衡功能。研究表明,即使在没有 dropout 的训练中,语言模型层相对较松散耦合,这些效应仍会发生。文章分析了这些效应对语言模型中的电路级归因的影响。
该论文研究了深度神经网络中偏见对模型性能的影响,并提出了降低其影响的方法。第一部分介绍了可解释人工智能的分类和方法,并提出了一种半自动数据探索方法。第二部分讨论了三种降低偏见影响的方法。这些方法的目标是减少偏见对机器学习模型的影响,而不是完全消除。
通过对儿童网站进行追踪和广告测量研究,发现追踪和广告安全不达标。建议监管机构和利益相关者采取更严格措施保护儿童和创造更安全的在线环境。
完成下面两步后,将自动完成登录并继续当前操作。