本文介绍了UC Berkeley CS188课程第三讲,重点讨论启发式搜索方法,包括贪婪搜索和A*搜索。启发式用于估计到达目标的距离,贪婪搜索选择启发值最低的节点,而A*搜索选择总成本最低的节点。A*搜索在启发式满足可接受性时是最优的。文中还涉及图搜索、启发式的主导性和一致性等概念。
本研究探讨了低秩适应微调方法在语法可接受性任务中的有效性,结果表明该方法在保持高准确度的同时显著降低了计算资源的使用,为更多用户提供了平等的访问机会。
本文介绍了首个多语言可接受性基准MELA,涵盖10种语言的48K样本。分析表明,ChatGPT在上下文实例中的表现优于XLM-R,但仍不及其精调版本。GPT-4在零-shot设置下与XLM-R性能相当,强调了语言内训练数据的重要性,并引入冲突权重概念作为跨语言转移困难的指标。
研究者构建了Cline数据集,包含16,642个英语-印地语混合文本句子,用于混合文本生成的质量控制。实验证明,基于混合代码指标训练的多层感知机模型表现更佳。研究者还进行了零样本转移可接受性判断,超过了随机基线。研究者公开发布了相关数据集、训练检查点、混合文本语料库和数据生成以及模型训练的代码。
本文提出了一种新的Graph Convolutional Neural Networks的表达方式,用于在具有噪声的生物医学知识图上进行链接预测。通过正则化的注意机制提高模型性能和可解释性。实验证明该方法在海量的生物医学知识图中优于其他模型。
完成下面两步后,将自动完成登录并继续当前操作。