DIMT25@ICDAR2025: HW-TSC's End-to-End Document Image Machine Translation System Leveraging Large Vision-Language Model
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了华为翻译服务中心的端到端文档图像机器翻译系统,解决了复杂布局问题。通过多任务学习和感知链思维的训练框架,显著提升了OCR和非OCR文档的翻译效果。
🎯
关键要点
- 本研究提出了华为翻译服务中心的端到端文档图像机器翻译系统,解决了复杂布局问题。
- 系统结合了多任务学习与感知链思维的训练框架。
- 该系统显著提升了OCR和非OCR文档的翻译效果。
- 研究展示了高效的文档翻译方法。
➡️