小红花·文摘

本文介绍了在PostgreSQL中生成随机测试数据的两种方法：轻量级方案和PL/pgSQL动态方案。轻量级方案利用内置函数快速生成数据，适合开发阶段；PL/pgSQL方案通过DO块动态适配任意表结构，适合需要反复填充多张表的场景。文章详细讲解了随机数生成、数据插入及动态执行的实现过程。

暗无天日 ·

合成数据是人工生成的，避免了隐私问题和高数据收集成本。本文介绍如何通过Python脚本生成合成数据，包括生成随机数据、引入关系和规则、模拟过程生成数据、创建时间序列和事件日志，以及生成文本数据。合成数据在测试和分析中非常有用，但需注意确保数据的真实性和隐私保护。

KDnuggets ·

我使用Hypothesis生成随机数据结构模式，并利用这些模式生成随机数据。在测试Hasher类时，Hypothesis未能生成有效数据。通过创建随机模式策略，我成功生成了相同“形状”的数据对，从而进行有效比较和测试，最终测试成功。Hypothesis的强大功能让我受益匪浅。

Ned Batchelder's blog ·

本文讨论了如何使用Hypothesis生成随机数据结构模式以测试Hasher类。作者通过创建随机模式策略，成功生成具有相同结构的数据对，从而有效比较和测试，最终测试成功，并意识到需要调整生成示例的数量以发现潜在错误。

Ned Batchelder's blog ·

DEV Community ·

DEV Community ·

本文讲解如何在Vertica数据库中填充随机数据，以销售表为例。步骤包括创建包含交易ID、客户ID、产品ID等字段的表，使用SQL插入随机数据，并验证记录数量。这有助于测试和验证查询性能。

DEV Community ·

KDnuggets ·

Percona Database Performance Blog ·