小红花·文摘

用 Cremers ESORICS 2011 的 IKEv2 形式化结论、RFC 9370 混合密钥交换与 Gazdag 等对 PQ 扩展的 Tamarin 分析，对照 WireGuard 的无协商立场，收束何时仍应选择 IPsec。

【IPSec】深度探讨：形式化证明、密码敏捷性与后量子

土法炼钢兴趣小组的博客 ·

Dowling–Paterson 对 1.5 RTT confirmation 的证明障碍、Donenfeld 的回应、netdev 上「无算法协商」争论、PSK 量子权宜之计，以及 WireGuard 作为 ZTNA 数据面的边界与开放问题。

【WireGuard】深度探讨：形式化证明、密码敏捷性与后量子

土法炼钢兴趣小组的博客 ·

自主谈判中的行为隐私泄露：通过随机策略形式化和缓解推断攻击

Apple Machine Learning Research ·

AI 范式雷达：《用形式化逻辑给 AI Agent 装上可证明的安全护栏》

Micropaper ·

一分钟读论文：《选择性形式化与门控执行》

Micropaper ·

AI Agent 安全与信任机制：2026 年形式化验证与 GDPR 合规

Micropaper ·

名为Gauss的AI在三周内完成了陶哲轩和Kontorovich提出的数学挑战，远超他们18个月的进展。该AI能自动形式化数学内容，生成约25000行Lean代码，未来计划提升形式化代码量100到1000倍，推动数学项目进展。

啥？陶哲轩18个月没搞定的数学挑战，被这个“AI高斯”三周完成了

量子位 ·

字节跳动与南京大学联合推出的CriticLean框架，将数学自然语言转化为Lean 4代码的准确率从38%提升至84%。该框架通过强化学习和评估模型，解决了数学形式化中的语义对齐和评价可靠性问题，显著增强了自动化定理证明能力。

超越DeepSeek-R1，数学形式化准确率飙升至84% | 字节&南大开源

量子位 ·

我们正在训练AI模型，需要提供20-50条verus训练数据，以提高代码输出效率和准确性。欢迎投简历，联系方式：764586552@qq.com，期待长期合作。

verus形式化程序验证兼职招募

Rust.cc ·

文章讨论了AI在数学推理和形式化证明方面的最新进展，特别是大模型的能力。5月29日将举行直播，邀请多个项目团队成员探讨AI数学的未来及其影响。

形式化证明与大模型：共创可验证的AI数学未来｜量子位直播

量子位 ·

Rust 编程语言在过去十年中因其内存安全性和高效性而受到开发者青睐。Niko 的文档探讨了 const Trait 的设计，xd009642 介绍了性能优化，Steven Vaughan-Nichols 讲述了 Rust 的起源与发展。

【Rust日报】2025-05-22 Niko 的 const Trait 形式化模型和语法设计

Rust.cc ·

本文介绍了高质量基准数据集CLEVER，包含161个专注于代码生成验证的问题。CLEVER避免了测试用例监督，确保输出通过Lean类型检查器验证，揭示了程序合成和形式推理的挑战。

CLEVER：一个经过精心策划的形式化验证代码生成基准

BriefGPT - AI 论文速递 ·

本研究旨在解决机器学习中缺乏统一理论框架及可解释性和伦理安全保障不足的问题。通过构建形式信息模型，提出机器学习理论的元框架（MLT-MF），并定义模型可解释性和伦理安全，为解决相关挑战提供理论基础。

机器学习的信息科学原理：基于形式化信息映射的因果链元框架

BriefGPT - AI 论文速递 ·

本研究提出了PDDLego+框架，旨在解决部分可观察环境中的规划问题，实现零样本迭代形式化和规划，展现出优越的性能和鲁棒性。

零样本迭代化形式化和规划在部分可观察环境中的应用

BriefGPT - AI 论文速递 ·

机器之心数据服务现已上线，提供高效稳定的数据获取，简化数据爬取流程。

Copilot上大分，仅数天，陶哲轩的估计验证工具卷到2.0！刚刚又发数学形式化证明视频

机器之心 ·

FormalMATH发布了5560道数学题的基准测试，以评估AI模型的数学推理能力。最佳模型的成功率仅为16.46%，显示出在严格逻辑推导方面的困难。研究团队提出了自动化流程以提高效率，并呼吁学术界共同推动形式化数学推理技术的发展。

挑战AI数学推理极限！大规模形式化数学基准FormalMATH发布，最强模型成功率仅16%

量子位 ·

正式语言（如模型检查和形式验证）对我来说是新知识，我希望在此进行简要回顾，以便快速参考。

内存模型与形式化

shrik3 ·

DeepSeek-Prover-V2：形式化数学推理的范式突破

我爱自然语言处理 ·

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

机器之心 ·

本研究探讨大型语言模型（LLMs）在形式化复杂数学定义中的局限性，并提出两个新资源以支持自动形式化。研究表明，数学定义的形式化难度较大，但通过外部反馈和引导策略，LLMs的自我修正能力显著提高，为其实际应用提供了新方向。

利用大型语言模型（LLMs）形式化复杂数学陈述：关于数学定义的研究

BriefGPT - AI 论文速递 ·