小红花·文摘

本研究探讨了利用零样本学习和大型语言模型（如FLAN-T5和BERT）提升电子邮件垃圾邮件检测的有效性，克服了传统检测技术在动态垃圾邮件策略和数据稀缺方面的局限，展现出良好的可扩展性和高效性。

Advancing Email Spam Detection: Leveraging Zero-Shot Learning and Large Language Models

BriefGPT - AI 论文速递 ·

大模型是否有自知之明？新研究发现LLM可以知晓自己的知识范围

机器之心 ·

本研究提出了一种基于Flan-T5的编码解码模型FlanEC，旨在改善自动语音识别中的语言和语法错误。通过扩展训练数据和多样化数据集，显著提升了错误修正效果。

FlanEC：探索Flan-T5用于自动语音识别后错误修正

BriefGPT - AI 论文速递 ·

研究提出了一种新方法，使语言模型在节点分类任务上达到与先进图神经网络相当的性能，无需改变架构。通过增强策略处理的Flan-T5模型超越了最先进的文本输出节点分类器，并与顶尖向量输出节点分类器表现相当。研究探索了大型语言模型在图学习中的潜力，提出了结合语言模型与图神经网络的方法，展示了其在无标签节点分类和图表示学习中的有效性。

语言模型是图学习者

BriefGPT - AI 论文速递 ·

我们研究了 LLM 基于零样本立场检测在推文上的表现，使用了 FlanT5-XXL 这一面向指令的开源 LLM，并使用了 SemEval 2016 任务 6A、6B 和 P-Stance...

使用 FlanT5-XXL 进行零样本立场检测的基准测试：对训练数据、提示和解码策略的洞见和接近 SoTA 的性能

BriefGPT - AI 论文速递 ·

通过RL的有针对性改写方法，使用FLAN T5作为生成器，通过近端策略梯度自动学习生成对抗性样本，改善模型性能。实验证明其在发现自然对抗性攻击和提高模型性能方面有效，优于强基准线，具有普适性。结合语言建模和强化学习的优势生成多样且有影响力的对抗性样本。

在敌对的草堆中寻找针头：一种针对性改写的方法，揭示最小分布畸变的边缘情况

BriefGPT - AI 论文速递 ·

本文讨论了使用GPT-3和Flan-T5等大型语言模型进行关系提取的问题。通过线性化生成目标字符串的方法，进行了序列到序列的任务处理。通过人工评估，在不同程度的监督下评估了它们在标准关系提取任务中的表现。发现GPT-3进行的少量提示与现有完全监督模型相当，而使用Chain-of-Thought风格的解释进一步监督和微调后，该模型产生了最优结果。

实体或关系嵌入：关系抽取编码策略分析

BriefGPT - AI 论文速递 ·