小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了XLM-R预训练模型在英语到日语和印尼语的跨语言迁移学习中的适用性。结果表明,该模型在日语数据集上表现最佳,并在其他数据集上也取得了良好效果,验证了多语言模型的有效性。

A Study on the Applicability of Zero-Shot Cross-Lingual Transfer Learning for Sentiment Classification in Distant Language Pairs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

该文章介绍了首个多语言语言可接受性基准MELA,并分析了经过精调的XLM-R的权重。结果显示ChatGPT在上下文实例方面表现良好,但仍落后于精调的XLM-R。GPT-4在零-shot设置中与精调的XLM-R性能相当。跨语言和多任务学习实验表明,语言内的训练数据对语言可接受度判断至关重要。文章还引入了冲突权重的概念,可能是跨语言转移困难的潜在指标。

METAL: 大型语言模型质量分析的变形测试框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-11T00:00:00Z

首个多语言语言可接受性基准MELA涵盖10种语言,分析了XLM-R的权重和语言转移困难,结果显示ChatGPT落后于精调的XLM-R,GPT-4在零-shot设置中性能相当。跨语言和多任务学习实验表明语言内的训练数据至关重要。引入了冲突权重的概念,可能是跨语言转移困难的指标。

MELA:多语言语言可接受性评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-15T00:00:00Z

该研究使用RoBERTa和XLM-R语言模型预测在线产品评论的帮助度,结果表明预训练语言模型比传统特征工程更有效,多语言模型表现更佳。但多语言模型不能用于单一语言的微调,评论人打的分数等附加特征也可以增强模型的预测准确度。

大型语言模型的零翻译双语应用评论挖掘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-06T00:00:00Z

本文介绍了基于印尼语版 Sirah Nabawiyah 文献构建的 QASiNa 数据集,并使用 mBERT、XLM-R 和 IndoBERT 模型进行了实验。结果显示,XLM-R 模型在 QASiNa 上表现最佳,而 Chat GPT 不适用于宗教领域的问答任务。

QASiNa:使用《先知传记》的宗教领域问答系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-12T00:00:00Z

本文研究了使用高资源语言预训练的模型权重作为启动来降低获取低资源语言高质量语言模型所需的数据和计算量的方法,并提出了一种嵌入初始化方法FOCUS,该方法在适应XLM-R时优于先前的方法。

Tik-to-Tok:一个逐令牌翻译语言模型的嵌入初始化策略用于有效语言适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码