晓飞的算法工程笔记 ·

1p-frac：已开源，仅用单张分形图片即可媲美ImageNet的预训练效果 | ECCV 2024 - 晓飞的算法工程笔记

💡 原文中文，约7500字，阅读约需18分钟。

📝

内容提要

分形几何是通过递归迭代生成图像的数学分支。研究发现，即使只有一个分形图像，也可以进行有效的预训练。通过引入局部扰动交叉熵损失函数，可以训练神经网络对小扰动进行分类。预训练可能只是更好的权重初始化，而不是发现有用视觉概念的必要条件。这对于减少预训练数据集的规模具有重要意义。

🎯

关键要点

分形几何是通过递归迭代生成图像的数学分支。
研究表明，即使只有一个分形图像，也能进行有效的预训练。
引入局部扰动交叉熵损失函数，可以训练神经网络对小扰动进行分类。
预训练可能只是更好的权重初始化，而不是发现有用视觉概念的必要条件。
这对于减少预训练数据集的规模具有重要意义。
论文提出了一个最小的、纯合成的预训练数据集，能够实现与 ImageNet-1k 相当的性能。
即使只有一个分形图像，也能进行有效的预训练。
局部整合经验分布可以使得即使只有一个分形图像也能进行预训练。
通过对真实图像进行增强，可以实现类似的预训练效果。
论文的贡献包括引入局部扰动交叉熵损失和局部整合经验分布。
研究表明，合成图像不应仅包含复杂形状，应该应用递归图像模式。
预训练数据集的大小可以显著减小，从100万张减少到仅1张，甚至改善预训练效果。

❓

延伸问答

什么是分形几何，它在图像生成中有什么应用？

分形几何是通过递归迭代生成图像的数学分支，主要应用于作图方面。

1p-frac方法如何实现有效的预训练？

1p-frac方法通过引入局部扰动交叉熵损失函数，使得即使只有一个分形图像也能进行有效的预训练。

使用单张分形图像进行预训练的优势是什么？

使用单张分形图像进行预训练可以显著减少数据集规模，从100万张减少到仅1张，同时仍能达到与ImageNet相当的性能。

局部扰动交叉熵损失函数的作用是什么？

局部扰动交叉熵损失函数用于训练神经网络，使其能够对小扰动进行分类，从而提高预训练效果。

研究表明，预训练是否一定需要大规模数据集？

研究表明，预训练可能只是更好的权重初始化，而不一定需要大规模数据集，这挑战了传统观点。

如何通过真实图像增强实现类似的预训练效果？

通过对真实图像进行增强，如灰度图像和仿射变换，可以实现类似的预训练效果。

🏷️

标签

imagenet 交叉熵损失函数分形几何局部扰动工程权重初始化算法预训练

➡️

继续阅读

法院批准A社与作者和出版社的15亿美元和解协议初步解决A社使用盗版图书训练模型问题
#人工智能法院批准 A 社与作者和出版社的 15 亿美元和解协议，初步解决 A 社使用盗版书籍训练模型的集体诉讼案件。法庭文件显示，A 社建立拥有 70...
AI驱动的CLO zFab面料测量套件开放全球供应
（全球TMT 2026年07月22日讯）CLO虚拟时尚宣布，AI驱动的面料数字化解决方案CLO zFab面料测 […]
AI 圈今天最大的瓜：GPT-6 越狱攻击，被 GLM 5.2 揪出了
「GPT-6」为了考试作弊，黑进了别人的服务器#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
IBM与亚湾超算将联手推出一体化AI平台
(全球TMT 2026年07月22日讯)IBM与鸿海科技集团旗下的亚湾超算（Visionbay.ai）在新加坡 […]
滤镜背后的色彩科学：LUT 是什么？
从风格滤镜，到电影中的专业调色，聊聊 LUT 所代表的色彩规则。查看全文
中国南方电网携电碳算协同与电力人工智能创新成果参展WAIC
(全球TMT 2026年07月22日讯)7月17日，2026世界人工智能大会暨人工智能全球治理高级别会议在上海 […]