作者通过多种方法提高翻译效果,发现用“目标语言重写”比直接“翻译”更自然,显著提升了翻译质量。
本研究解决了在低资源语言中生成对话的挑战,现有方法依赖于大规模对话语料库。通过创新的跨语言代码切换方法,提出了零-shot对话生成模型ChatZero,并通过无监督对比学习来缩小源语言和伪目标语言之间的语义差距。实验结果表明,ChatZero在多语言数据集上表现出色,达到了监督学习的90%以上性能,且在其他基线中取得了最新的性能。
本文探讨了大型语言模型(LLMs)在文本难度控制中的应用,评估了少样本提示、监督微调和强化学习等方法的效果。研究发现,GPT-4与开源模型之间存在性能差距,但通过精调和强化学习的结合可以缩小这一差距。提出的CALM模型在成本低的情况下超越了GPT-4的表现,验证了其在教育和学习应用中的潜力。
该研究提出了一种自动提示优化方法,用于以情绪为条件的文本生成。通过迭代的优化过程,改变提示中的标记,以实现情感条件。与手动设计的提示相比,优化的提示在实现情感条件方面表现更好。
本研究比较了几种生成合成源句子的方法,发现采样或噪声束搜索的反向翻译效果最佳。同时,将该方法扩展到数亿条单语数据,取得了35 BLEU的最新记录。
本文介绍了一种使用5-gram KenLM语言模型的新方法,通过Kneser-ney平滑技术过滤域外数据,提高机器翻译质量。同时采用多域、微调和迭代回译等自适应技术,在Hindi-Nepali语言对上提高了BLEU点数。
该研究使用机器学习探索了将英语翻译成形式化特征语言的问题,并通过印地语进行了实验。研究使用转换器模型评估了翻译的正式性准确性,结果显示了一种灵活的翻译策略,适应了多样化的语言交流需求和场景。
该研究介绍了如何在端到端语音翻译中引入目标语言上下文,以增强连贯性并克服扩展音频片段的内存限制。同时,提出了上下文丢弃以确保对上下文缺失的鲁棒性,并通过添加说话者信息进一步提高性能。研究表明,上下文信息主要有助于捕捉上下文风格,并解决指代和命名实体问题。
这是一个文本框翻译插件,可以实时翻译Chrome浏览器中的文本框内容。安装后钉在工具栏,设置目标语言和触发标识。输入触发标识后自动翻译。适用于Google、Twitter、微博等输入框。作者欢迎用户提问和建议,推荐给其他人使用。
完成下面两步后,将自动完成登录并继续当前操作。