小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了利用零样本学习和大型语言模型(如FLAN-T5和BERT)提升电子邮件垃圾邮件检测的有效性,克服了传统检测技术在动态垃圾邮件策略和数据稀缺方面的局限,展现出良好的可扩展性和高效性。

Advancing Email Spam Detection: Leveraging Zero-Shot Learning and Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z
大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围

研究发现,大型语言模型(LLM)具备知识意识,能够评估自身对某一主题的掌握程度。模型规模越大,性能越好,但数据集过大可能导致性能下降。不同架构的模型表现差异明显,Flan-T5在简化设置下表现优异,但在标准设置中效果不佳。总体而言,LLM在足够规模下展现出知识意识。

大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围

机器之心
机器之心 · 2025-03-01T13:04:50Z

本研究提出了一种基于Flan-T5的编码解码模型FlanEC,旨在改善自动语音识别中的语言和语法错误。通过扩展训练数据和多样化数据集,显著提升了错误修正效果。

FlanEC:探索Flan-T5用于自动语音识别后错误修正

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

研究提出了一种新方法,使语言模型在节点分类任务上达到与先进图神经网络相当的性能,无需改变架构。通过增强策略处理的Flan-T5模型超越了最先进的文本输出节点分类器,并与顶尖向量输出节点分类器表现相当。研究探索了大型语言模型在图学习中的潜力,提出了结合语言模型与图神经网络的方法,展示了其在无标签节点分类和图表示学习中的有效性。

语言模型是图学习者

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

我们研究了 LLM 基于零样本立场检测在推文上的表现,使用了 FlanT5-XXL 这一面向指令的开源 LLM,并使用了 SemEval 2016 任务 6A、6B 和 P-Stance...

使用 FlanT5-XXL 进行零样本立场检测的基准测试:对训练数据、提示和解码策略的洞见和接近 SoTA 的性能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-01T00:00:00Z

通过RL的有针对性改写方法,使用FLAN T5作为生成器,通过近端策略梯度自动学习生成对抗性样本,改善模型性能。实验证明其在发现自然对抗性攻击和提高模型性能方面有效,优于强基准线,具有普适性。结合语言建模和强化学习的优势生成多样且有影响力的对抗性样本。

在敌对的草堆中寻找针头:一种针对性改写的方法,揭示最小分布畸变的边缘情况

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-21T00:00:00Z

本文讨论了使用GPT-3和Flan-T5等大型语言模型进行关系提取的问题。通过线性化生成目标字符串的方法,进行了序列到序列的任务处理。通过人工评估,在不同程度的监督下评估了它们在标准关系提取任务中的表现。发现GPT-3进行的少量提示与现有完全监督模型相当,而使用Chain-of-Thought风格的解释进一步监督和微调后,该模型产生了最优结果。

实体或关系嵌入:关系抽取编码策略分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码