张善友 ·

OpenAI Code Interpreter ("Coworker") 架构审计与安全取证分析 - 张善友

💡 原文中文，约10700字，阅读约需26分钟。

📝

内容提要

本文分析了OpenAI 'Code Interpreter'泄露事件，揭示其复杂架构是基于.NET 9和C#的多语言系统，而非单一Python环境。泄露显示文档处理依赖C#引擎，Excel功能实际上调用PowerPoint渲染，且安全机制薄弱，路径检查易被绕过，暴露了安全隐患。

🎯

🔎

OpenAI 'Code Interpreter' 的架构复杂性不仅体现在多语言的使用上，还暴露了安全隐患。C# 引擎的使用虽然提升了性能，但其安全机制却显得薄弱，路径检查容易被绕过。这提醒开发者在追求性能的同时，必须重视安全性，避免因架构设计不当而导致的潜在风险。

泄露事件揭示了 OpenAI 实际上并没有原生的 Excel 渲染引擎，而是依赖 PowerPoint 的渲染能力。这种设计虽然降低了开发成本，但也导致了功能的同质化，可能影响用户体验。开发者在设计系统时应考虑功能的独特性与用户需求，避免过度依赖单一模块。

泄露的代码中反映出开发者面临的工期压力，功能缺失与开发进度直接相关。这种情况不仅影响了系统的稳定性，也可能导致技术债务的积累。团队应在项目管理中平衡速度与质量，确保技术债务不会影响未来的开发与维护。

❓

OpenAI Code Interpreter的架构基于.NET 9和C#，而非单一的Python环境，显示出其复杂的多语言系统特性。

Code Interpreter并没有原生的Excel渲染引擎，而是依赖PowerPoint的渲染引擎来处理Excel功能。

泄露事件显示安全机制薄弱，路径检查易被绕过，应用层文件系统访问控制原始，存在路径穿越漏洞。

文档处理能力依赖于C#引擎，采用'Roundtrip'架构，通过Protobuf格式进行数据交互，限制LLM的操作范围。

开发过程中存在工期压力，导致功能缺失，代码中反映出开发者的工作进度与功能实现直接相关。

安全审计显示应用层的文件系统访问控制极其原始，防御机制依赖简单的字符串匹配，存在严重的安全漏洞。

🏷️