小红花·文摘

本文讨论了eBPF程序中常见的验证器拒绝模式及其排障方法，涵盖18种模式，如空指针解引用、边界检查缺失和指针算术错误。通过分析验证器日志，提供系统化的排查流程，帮助开发者快速定位和修复问题，提高调试效率。

【eBPF 内核实现深度拆解】与验证器共舞：常见拒绝模式与编程约束

土法炼钢兴趣小组的博客 ·

停止将可在IDE中捕获的AI代码错误发送至审查

The JetBrains Blog ·

本研究提出了一种新方法，通过规则定义检测训练数据中的偏见和缺陷，以建立可信的模型基准。该方法适用于小规模数据集，扩展了传统统计测试的应用。

Statistical Testing of Undesirable Error Patterns in Training Data Using Rule-Based Regression

BriefGPT - AI 论文速递 ·

本研究提出了一种统一的组合因果推理框架，以解决生成性AI中因果推理评估不足的问题。实验揭示了语言模型的错误模式，尤其在复杂因果路径下错误率显著增加，展示了该框架的应用价值。

Evaluation of Combinatorial Causal Reasoning in Language Models

BriefGPT - AI 论文速递 ·

本研究提出了SpecTool基准，识别大型语言模型（LLMs）在工具使用任务中的错误模式。基准包含七种新表征错误模式的查询数据集，研究表明即使是最优秀的LLMs也存在这些错误，为研究者提供了错误缓解策略的分析与见解。

SpecTool: A Benchmark for Characterizing Errors in Tool-Using Large Language Models (LLMs)

BriefGPT - AI 论文速递 ·

SpotBugs是一个开源静态分析工具，用于查找Java代码中的错误。它可以识别400多种错误模式，包括空指针引用、死锁和安全漏洞等。通过修复代码中的错误，可以提高代码质量。

SpotBugs 简介

极道 ·

大型语言模型（LLMs）在自然语言理解和代码生成方面表现出色，但其生成代码的可靠性和鲁棒性仍需深入研究。研究提出了一个包含1208个编程问题的数据集RobustAPI，发现62%的GPT-4生成代码存在API误用，并分析了333个错误模式。研究旨在为开发代码质量保证技术提供依据，并探讨LLMs在代码生成和漏洞检测中的应用与挑战。

大语言模型生成的代码有什么问题？一项广泛研究

BriefGPT - AI 论文速递 ·