💡
原文英文,约300词,阅读约需1分钟。
📝
内容提要
在博士期间,我与导师和同事共同开发了一种算法,改善数字相机拍摄的文档照片。该算法通过四个步骤校正不均匀光照,类似于CamScanner,使用C++实现,源代码可在GitHub上找到。
🎯
关键要点
- 在博士期间,与导师和同事共同开发了一种算法,改善数字相机拍摄的文档照片。
- 该算法通过四个步骤校正不均匀光照,类似于CamScanner。
- 算法的实现使用C++编写,源代码可在GitHub上找到。
- 第一步:检测低变化区域,识别图像中颜色变化较小的区域,通常对应于纸张的空白区域。
- 第二步:背景聚类,从低变化区域中提取最可能代表纸张真实背景的聚类。
- 第三步:阴影估计,识别纸张背景后,估计文档其余部分的阴影模式。
- 在阴影估计中使用了自然邻域插值技术,适用于数据点分布不均的情况。
- 为插值和几何计算使用了CGAL库,并依赖Boost C++库的数据结构。
- 第四步:最终增强,去除前一步获得的阴影。
- 完整源代码和论文均可在GitHub和ResearchGate上找到。
❓
延伸问答
这个算法是如何改善文档照片的?
该算法通过四个步骤校正不均匀光照,首先检测低变化区域,然后进行背景聚类,接着估计阴影,最后去除阴影以增强图像。
这个算法的实现使用了什么编程语言?
算法的实现使用C++编写。
我在哪里可以找到这个算法的源代码?
完整源代码可以在GitHub上找到,链接是:https://github.com/dmo2000/shading-removal-illustrated-docs。
阴影估计中使用了什么技术?
阴影估计中使用了自然邻域插值技术,这种技术适用于数据点分布不均的情况。
这个算法的背景聚类步骤是如何进行的?
背景聚类步骤从低变化区域中提取最可能代表纸张真实背景的聚类。
这个算法的完整论文在哪里可以找到?
完整论文可以在ResearchGate上找到,链接是:https://www.researchgate.net/publication/300028589_Shading_Removal_of_Illustrated_Documents。
➡️