💡
原文约900字/词,阅读约需4分钟。
📝
内容提要
该项目涉及重要的数据迁移,面临服务器共享、备份时间不确定和重复文件等问题。Drupal的迁移框架在处理大规模数据时存在不足,尤其是时间戳相同的文件迁移。为优化迁移过程,提出通过自定义源和动态方法来避免重复和错误。
🎯
关键要点
- 该项目涉及重要的数据迁移,面临服务器共享和备份时间不确定等问题。
- Drupal的迁移框架在处理大规模数据时存在不足,尤其是时间戳相同的文件迁移。
- 项目中有大量文件,约300,000条记录,其中70,000条为重复文件。
- 使用hash_file函数可能导致内存不足,容易出现PHP错误。
- 迁移过程中可以使用'--limit='标志控制迁移数量,但存在已迁移记录的重复处理问题。
- Highwater Marks选项允许定义时间戳字段,但在处理大量相同时间戳文件时会导致遗漏。
- 提出通过自定义源和动态方法来优化迁移过程,避免重复和错误。
- 动态方法通过获取最后的ID来控制迁移,确保不遗漏文件。
➡️