JetBrains Research推出了Long Code Arena,包含六个基准测试,要求模型以整个项目作为输入。这些测试将帮助研究人员训练下一代智能AI代码模型。GPT-4在多个任务中表现最好。Long Code Arena是领域内第一个具有大量上下文的数据集,将推动代码模型的发展。
完成下面两步后,将自动完成登录并继续当前操作。