插图文档的阴影去除

插图文档的阴影去除

💡 原文英文,约300词,阅读约需1分钟。
📝

内容提要

在博士期间,我与导师和同事共同开发了一种算法,改善数字相机拍摄的文档照片。该算法通过四个步骤校正不均匀光照,类似于CamScanner,使用C++实现,源代码可在GitHub上找到。

🎯

关键要点

  • 在博士期间,与导师和同事共同开发了一种算法,改善数字相机拍摄的文档照片。
  • 该算法通过四个步骤校正不均匀光照,类似于CamScanner。
  • 算法的实现使用C++编写,源代码可在GitHub上找到。
  • 第一步:检测低变化区域,识别图像中颜色变化较小的区域,通常对应于纸张的空白区域。
  • 第二步:背景聚类,从低变化区域中提取最可能代表纸张真实背景的聚类。
  • 第三步:阴影估计,识别纸张背景后,估计文档其余部分的阴影模式。
  • 在阴影估计中使用了自然邻域插值技术,适用于数据点分布不均的情况。
  • 为插值和几何计算使用了CGAL库,并依赖Boost C++库的数据结构。
  • 第四步:最终增强,去除前一步获得的阴影。
  • 完整源代码和论文均可在GitHub和ResearchGate上找到。

延伸问答

这个算法是如何改善文档照片的?

该算法通过四个步骤校正不均匀光照,首先检测低变化区域,然后进行背景聚类,接着估计阴影,最后去除阴影以增强图像。

这个算法的实现使用了什么编程语言?

算法的实现使用C++编写。

我在哪里可以找到这个算法的源代码?

完整源代码可以在GitHub上找到,链接是:https://github.com/dmo2000/shading-removal-illustrated-docs。

阴影估计中使用了什么技术?

阴影估计中使用了自然邻域插值技术,这种技术适用于数据点分布不均的情况。

这个算法的背景聚类步骤是如何进行的?

背景聚类步骤从低变化区域中提取最可能代表纸张真实背景的聚类。

这个算法的完整论文在哪里可以找到?

完整论文可以在ResearchGate上找到,链接是:https://www.researchgate.net/publication/300028589_Shading_Removal_of_Illustrated_Documents。

➡️

继续阅读