小红花·文摘

大规模数据集挖掘：数据科学爱好者的终极指南

DEV Community ·

本文讨论了采购系统中海量数据的治理和存储优化，以lifecycle表为例，提出了迁移方案，保证了读写稳定和准确，最终完成了整体平滑迁移。

分享一次海量数据平滑迁移实战

京东科技开发者 ·

本文介绍了分布式唯一Id的重要性和使用方法，以及在.Net Core和.Net Framework环境下的示例代码。分布式唯一Id是构建高并发、海量数据、大型分布式应用的核心，可以避免重复的订单Id和修改的麻烦。推荐将分布式唯一Id作为数据库中每个表的主键。

大企业才用的分布式唯一Id，它比GUID好

dotNET跨平台 ·

MaxCompute按量付费闲时版是一种共享型按量付费计算资源，适用于延迟不敏感的作业。它可以降低使用MaxCompute的成本，特别适用于低价值、海量数据的分析场景。使用按量付费闲时版可以节省计算成本，但不适合生产环境。计费公式与标准版作业一致，但单价更低。一个案例显示，使用按量付费闲时版可以将作业成本降低为原来的三分之一。

MaxCompute 发布按量付费闲时版，计算成本最高节省66.66%！

阿里云云栖号 ·

深度学习通过模拟生物神经网络构建人工神经网络，擅长处理海量数据和抽象概念，但需要强大算力和海量数据。采用分层架构实现对输入数据的多层次抽象和变换，难以解释。可以处理各种类型的数据和问题，如图像、语音、文本、分类、回归、生成等。GPT大模型展现了深度学习的可能性和创新性。

深度学习 - 蝈蝈俊

蝈蝈俊 ·