DIMT25@ICDAR2025: HW-TSC's End-to-End Document Image Machine Translation System Leveraging Large Vision-Language Model

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了华为翻译服务中心的端到端文档图像机器翻译系统,解决了复杂布局问题。通过多任务学习和感知链思维的训练框架,显著提升了OCR和非OCR文档的翻译效果。

🎯

关键要点

  • 本研究提出了华为翻译服务中心的端到端文档图像机器翻译系统,解决了复杂布局问题。
  • 系统结合了多任务学习与感知链思维的训练框架。
  • 该系统显著提升了OCR和非OCR文档的翻译效果。
  • 研究展示了高效的文档翻译方法。
➡️

继续阅读