小红花·文摘

GPT-4是最先进的语言模型，在MaTT基准测试中的多项选择场景中仅达到54%的准确率。即使有提示，提升也很小。在没有选项的情况下，大型语言模型的准确率下降了24.2个百分点。大型语言模型在不同数学子主题上的表现差异显著。人工评估发现，只有53.3%的解释被认为是完整和准确的。

BriefGPT - AI 论文速递 ·

本文介绍了基于Transformer架构的TC-BrainTF模型，该模型通过神经科学研究提高了识别自闭症谱系障碍（ASD）和性别分类的准确性。文章还展示了TC模块的有效性及其与神经科学解释的相关性。

BriefGPT - AI 论文速递 ·