小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Mistral的Leanstral想要消除人类参与的代码检查,但这是否只是空中楼阁?

Mistral AI推出的Leanstral是一个开源代码代理,旨在解决软件工程中的人类审查瓶颈。该工具通过形式验证确保代码按规范执行,使用Lean 4编程语言和交互定理证明器。尽管Leanstral在数学上精确,但其有效性依赖于人类开发者提供的完整应用规范。专家指出,AI风险不仅在于数学,还在于规范的完整性和现实对齐,人类在软件开发中仍然不可或缺。

Mistral的Leanstral想要消除人类参与的代码检查,但这是否只是空中楼阁?

The New Stack
The New Stack · 2026-04-24T16:04:18Z
陶哲轩最新演讲:AI 不是来抢数学家蛋糕的,是来把蛋糕做大的

陶哲轩在演讲中指出,人工智能(AI)并非要取代数学家,而是帮助扩展数学研究的范围。他强调形式验证是促进大规模数学协作的关键,能够解决信任问题。他的项目在三个月内解决了2200万道代数题,展示了AI与人类合作的潜力。AI应被视为工具,帮助处理大量中等难度问题,让数学家专注于更复杂的挑战。

陶哲轩最新演讲:AI 不是来抢数学家蛋糕的,是来把蛋糕做大的

宝玉的分享
宝玉的分享 · 2026-03-04T00:00:00Z

大语言模型(LLMs)应优先考虑强类型编程语言,以提高代码生成的可靠性。当前的弱类型语言如JavaScript可能导致不确定性,影响AI生成代码的准确性。形式验证和专为AI设计的新语言可能是未来的解决方案,以确保代码的正确性和可靠性。

大语言模型(LLMs)应该用什么语言编程?

程序师
程序师 · 2025-08-18T09:29:01Z
形式验证及我为何爱上它

作为一名大四学生,我对形式验证产生了浓厚的兴趣。起初觉得复杂,但逐渐认识到它在智能合约和区块链中的重要性。我从《如何证明它》入手,掌握了逻辑和证明的基础,现在正在学习使用Coq进行简单的逻辑证明。我希望成为区块链领域的形式验证工程师,助力构建更安全的协议。

形式验证及我为何爱上它

DEV Community
DEV Community · 2025-05-17T01:13:54Z

正式语言(如模型检查和形式验证)对我来说是新知识,我希望在此进行简要回顾,以便快速参考。

内存模型与形式化

shrik3
shrik3 · 2025-05-07T16:37:40Z

本文提出了FormalMATH,一个包含5560个经过形式验证的数学问题的大型基准,旨在提升人工智能的形式数学推理能力。研究通过人机协作的自动形式化流程,降低了专业标注成本,并揭示了当前语言模型在形式证明中的局限性,为未来研究指明了方向。

FormalMATH: Benchmarking Formal Mathematical Reasoning of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z

Rust 的不安全特性并不影响其内存安全性。尽管实现中可能包含不安全操作,只要遵循正确的接口和语义,Rust 仍能保持安全。通过形式验证和局部分析,Rust 有效管理不安全代码,确保扩展不会引发问题。

“unsafe”是否会破坏 Rust 的保证?

程序师
程序师 · 2025-03-20T01:57:37Z

VeriPlan系统通过形式验证技术提升了大型语言模型在用户规划中的可靠性和灵活性,解决了传统自动化规划中用户信任不足的问题,显著改善了用户对模型的感知质量和满意度。

VeriPlan: Integrating Formal Verification and Large Language Models into End-User Planning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-25T00:00:00Z

本研究提出了一种基于“这里与那里”逻辑的替代语义,以解决回答集编程中的形式验证挑战,促进逻辑程序的模块化理解,并利用自动定理证明工具验证程序特性,旨在简化ASP验证。

将回答集编程与多排序逻辑联系起来进行形式验证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

该研究提出了工具Marmaragan,利用大型语言模型为程序生成SPARK注释,以实现代码形式验证。实验结果显示其能正确生成50.7%的注释,为未来结合LLM与形式验证奠定基础。

在软件验证背景下验证LLM生成的代码与Ada/SPARK

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了一种自动从系统行为生成规格的方法,解决了形式验证中手动制定规格的挑战与易错性,并比较了不同的LTL规格挖掘技术,对形式方法实践者具有重要指导意义。

What is Formal Verification Without Specifications? A Review on Mining LTL Specifications

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本研究探讨了变换器在自动化形式验证中的应用,通过将研究论文中的形式化证明转化为可验证代码,降低了形式验证的门槛,提高了代码的可靠性与安全性。

From Scientific Text to Verifiable Code: Automating the Process Using Transformers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z
公告:2025年FOSDEM大会Ada开发者房间

2025年2月2日,布鲁塞尔FOSDEM大会将举办Ada开发者房间,介绍Ada语言及其生态系统,主题包括压缩编码、液体类型和形式验证等。

公告:2025年FOSDEM大会Ada开发者房间

DEV Community
DEV Community · 2024-12-20T10:49:52Z

本文探讨了形式验证中对专家知识的需求,并提出了Rango工具,该工具能够自动识别相关前提和相似证明,从而优化合成过程。Rango显著提高了证明的有效性,在多个开源项目中成功合成了32.0%的定理,较之前工具提升了29%。

Rango: An Automated Software Verification Tool with Adaptive Retrieval Enhancement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了AlphaVerus框架,旨在解决自动化代码生成中的形式验证不足问题。通过自我改进的翻译和验证器反馈,AlphaVerus显著提高了生成代码的正确性,并展示了在HumanEval和MBPP等问题上的潜力。

AlphaVerus: Bootstrapping Formally Verified Code Generation through Self-Improving Translation and Tree Refinement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

Cloudflare通过形式验证确保其权威DNS配置的正确性,避免冲突。Topaz系统验证DNS查询的IP地址选择逻辑,确保不同团队的程序不冲突。每当程序更改时,都会通过模型检查器检测潜在错误,从而提高互联网的可靠性,鼓励其他网络运营商采用形式方法。

我们如何通过形式验证防止权威DNS配置中的冲突

The Cloudflare Blog
The Cloudflare Blog · 2024-11-08T14:00:00Z
苹果公司正式加入 seL4 基金会

苹果公司加入seL4基金会,成为普通会员,具有投票权。seL4是第一个通过形式验证的安全操作系统内核,对航空航天、自动驾驶汽车、医疗设备等行业具有重要意义。

苹果公司正式加入 seL4 基金会

开源工场
开源工场 · 2024-04-30T02:33:51Z
蘋果公司正式加入 seL4 基金會

seL4基金会于2024年4月29日宣布苹果公司成为其普通会员,享有投票权。seL4是全球首个通过形式验证的安全操作系统内核,广泛应用于航空航天和自动驾驶等领域,由澳大利亚CSIRO/Data61开发,具备高性能和安全性。

蘋果公司正式加入 seL4 基金會

开源工场
开源工场 · 2024-04-30T02:33:51Z

形式验证的历史和方法,包括形式推理、可证明的递归函数和类型论。形式验证对编程语言理论的影响,包括类型系统的发展和依赖类型语言的应用。实践方面包括SMT求解器、程序逻辑和模型检查。

形式验证的历史和方法

极道
极道 · 2024-02-23T00:30:00Z

数学家陶哲轩在使用Lean4时发现一篇已发表论文中的错误,计划将语言模型与证明助手连接起来。Lean4主要用于写数学证明,也可用于编程。形式验证可减少软件开发中的错误。

数学家陶哲轩在形式证明帮助下发现论文中错误

极道
极道 · 2023-10-27T22:33:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码