小红花·文摘

Heroku怀旧陷阱：为什么简单部署并不是唯一的答案

freeCodeCamp.org ·

在Elasticsearch中，动态映射根据字段内容推断数据类型，这可能导致不一致的结果。未指定映射时，字段类型可能随机，从而影响搜索结果的准确性。因此，建议在动态映射模板中明确指定字段映射，以确保数据的正确性。

Elasticsearch动态映射陷阱

jdhao's blog ·

透明度陷阱

mongona news ·

文章讨论了Linux系统中浏览器无法弹出文件选择框的问题，原因是xdg-desktop-portal-gtk服务启动失败，无法找到DISPLAY环境变量。分析发现服务在图形环境准备好之前尝试启动，导致失败。解决方案是将DISPLAY变量导入systemd用户会话，并重新启动portal服务。理想的修复是为服务添加Requisite依赖，以确保在没有图形环境时不启动。

浏览器文件选择框弹不出来——xdg-desktop-portal 启动时序陷阱

暗无天日 ·

本文探讨了Python中mock和patch的使用及其陷阱。通过货币转换的例子，指出mock可能未能拦截真实请求，导致测试无效。强调验证mock是否生效的重要性，建议使用assert_called_once()进行检查。同时讨论了patch目标位置的重要性及mock的其他用途，如制造碰撞。最后，建议在某些情况下使用适配器模式进行测试，以避免依赖外部服务。

读：Python mock/patch 用法与陷阱

暗无天日 ·

DRY陷阱：宁要重复代码也不要错误抽象

极道 ·

本文讨论了ClickHouse的默认设置及其在中等批量OLAP中的应用，特别是与Kafka和ORM的插入方式。重点分析了MergeTree配置、内存与磁盘容量估算、监控及故障模式，并提供了配置层级、插入阈值、合并线程池等设置的详细说明，强调了SSD与HDD的策略差异。最后，提出了容量规划的工作流和配置审查清单，以优化性能和资源使用。

【列存引擎内核】配置陷阱与容量规划

土法炼钢兴趣小组的博客 ·

人工智能没有意识：华裔科幻作家拆穿AI人格化背后认知陷阱

极道 ·

烧毁工程团队的DIY平台陷阱

The New Stack ·

AI 优化 1.5ms，手写 0.02ms！Ghostty 作者痛批 AI 编程“平庸陷阱”

Tony Bai ·

PPO（近端策略优化）通过裁剪目标和重要性采样比率解决策略梯度的信任域问题。文章探讨了PPO的实现细节，包括优势归一化、价值裁剪和KL惩罚，强调在多轮minibatch更新中保持策略稳定的重要性。训练日志分析有助于识别正常探索与策略失效的信号，并讨论了PPO在RLHF（人类反馈强化学习）中的应用，指出奖励模型和参考策略的影响。

【强化学习与大模型后训练】05｜PPO 深度解剖：裁剪目标、KL 约束与实现陷阱

土法炼钢兴趣小组的博客 ·

本文探讨了字符串处理的复杂性，特别是UTF-8编码及其验证算法。UTF-8由Ken Thompson和Rob Pike设计，兼容ASCII并具备自同步性。文章还介绍了Unicode的规范化、字素簇、排序算法及双向排版等概念，强调在处理文本时需考虑字符的多样性和复杂性，建议使用ICU库进行规范化和验证，以确保安全性和正确性。

Unicode 算法：UTF-8 的精妙与文本处理陷阱

土法炼钢兴趣小组的博客 ·

Composer 2.5规划编程陷阱：单元测试全绿为何代码仍出bug

极道 ·

本文介绍了在 Dired 中按修改时间标记文件的技巧，重点是使用 dired-mark-if 宏和处理夏令时问题。提供了代码示例，强调了正确的时间计算顺序：先减天数，再清零时分秒，以避免夏令时切换带来的错误。

TIL: dired 里按时间标记文件——dired-mark-if 与夏令时陷阱

暗无天日 ·

个性化健康的承诺与陷阱

The Verge ·

本文讨论了利用大型语言模型（LLM）重构遗留代码的经验与教训，指出了三个主要陷阱：未测试即重构、过度工程化和全盘重写。重构前应编写特征测试以记录当前行为，避免系统崩溃。重构应逐步进行，确保每个模块正常运行。作者提出了一套五步方法，强调保持可逆性和清晰的工程纪律。

读：用 LLM 重构遗留代码——三个陷阱与一套方法

暗无天日 ·

AI陷阱：监督悖论导致的人类自身技能退化

极道 ·

AI 正在把我们推向“双输”深渊：顶级论文揭示“AI 裁员陷阱”

Tony Bai ·

回测中常见的偏差包括幸存者偏差、前视偏差和未来函数，这些偏差导致回测结果与实盘表现不符。幸存者偏差只考虑存活公司的数据，前视偏差使用未来信息进行决策，而未来函数在特征生成中引入未来数据，造成信息泄漏。为解决这些问题，需要建立严格的数据管理和回测流程，确保数据的准确性和可用性，避免策略失效。

【量化交易】数据陷阱：幸存者偏差、复权、前视、未来函数

土法炼钢兴趣小组的博客 ·

时序深度学习在量化金融中的应用面临挑战，包括标签和窗口口径错误、训练与推理统计分布不对齐、模型对随机种子的敏感性等。文章探讨了在量化场景中有效使用时序深度学习的方法，强调TCN和Transformer的适配问题，以及通过集成方法降低过拟合风险。工程实践中需关注模型的训练、推理延迟和监控指标，以确保模型的稳定性和有效性。

【量化交易】时间序列深度学习：TCN、Transformer 在量化的实践与陷阱

土法炼钢兴趣小组的博客 ·