重新思考事实验证的损失函数
在这篇文章中,我们探索了用于 FEVER 共享任务中事实验证的损失函数。实验结果表明,我们提出的目标函数优于标准的交叉熵,并且当这些目标函数与简单的类别加权结合时,性能进一步提高。
本文介绍了一个新的公开可用的数据集 FEVER:事实提取和验证,包含185,445个主张。作者使用流水线方法对该数据集进行测试,最佳准确性达到了31.87%。FEVER是一个具有挑战性的测试平台,可以促进对文本来源的声明验证的进展。
BriefGPT - AI 论文速递 -
在这篇文章中,我们探索了用于 FEVER 共享任务中事实验证的损失函数。实验结果表明,我们提出的目标函数优于标准的交叉熵,并且当这些目标函数与简单的类别加权结合时,性能进一步提高。
本文介绍了一个新的公开可用的数据集 FEVER:事实提取和验证,包含185,445个主张。作者使用流水线方法对该数据集进行测试,最佳准确性达到了31.87%。FEVER是一个具有挑战性的测试平台,可以促进对文本来源的声明验证的进展。
热榜 Top10
标签 Top100
全部ai 语言模型 神经网络 linux llm 开源 微软 .net python 数据集 人工智能 google 算法 apple 扩散模型 安全 苹果 机器学习 java android 深度学习 游戏 rust postgresql 机器人 建模 漏洞 谷歌 ios openai mysql windows c# 大模型 spring api 开发者 函数 gpt github chatgpt 卷积 教程 microsoft windows 11 数据库 nvidia web mongodb iphone 内存 浏览器 强化学习 security sql 插件 docker cloud 编码器 wordpress 基准测试 欧盟 程序员 黑客 mac 大语言模型 总结 入门 联邦学习 postgres 流量 无监督 解决方案 sora c++ 一致性 generative ai 视图 网络安全 点云 spring boot redis 工程师 硬件 pdf swift 前端 单片机 重建 接口 多智能体 git 源码 kubernetes 容器 visual studio 马斯克 面试 cpu 内核
赞助商
我也要赞助推荐或自荐