小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Mistral的Leanstral想要消除人类参与的代码检查,但这是否只是空中楼阁?

Mistral AI推出的Leanstral是一个开源代码代理,旨在解决软件工程中的人类审查瓶颈。该工具通过形式验证确保代码按规范执行,使用Lean 4编程语言和交互定理证明器。尽管Leanstral在数学上精确,但其有效性依赖于人类开发者提供的完整应用规范。专家指出,AI风险不仅在于数学,还在于规范的完整性和现实对齐,人类在软件开发中仍然不可或缺。

Mistral的Leanstral想要消除人类参与的代码检查,但这是否只是空中楼阁?

The New Stack
The New Stack · 2026-04-24T16:04:18Z
陶哲轩最新演讲:AI 不是来抢数学家蛋糕的,是来把蛋糕做大的

陶哲轩在演讲中指出,人工智能(AI)并非要取代数学家,而是帮助扩展数学研究的范围。他强调形式验证是促进大规模数学协作的关键,能够解决信任问题。他的项目在三个月内解决了2200万道代数题,展示了AI与人类合作的潜力。AI应被视为工具,帮助处理大量中等难度问题,让数学家专注于更复杂的挑战。

陶哲轩最新演讲:AI 不是来抢数学家蛋糕的,是来把蛋糕做大的

宝玉的分享
宝玉的分享 · 2026-03-04T00:00:00Z

大语言模型(LLMs)应优先考虑强类型编程语言,以提高代码生成的可靠性。当前的弱类型语言如JavaScript可能导致不确定性,影响AI生成代码的准确性。形式验证和专为AI设计的新语言可能是未来的解决方案,以确保代码的正确性和可靠性。

大语言模型(LLMs)应该用什么语言编程?

程序师
程序师 · 2025-08-18T09:29:01Z
形式验证及我为何爱上它

作为一名大四学生,我对形式验证产生了浓厚的兴趣。起初觉得复杂,但逐渐认识到它在智能合约和区块链中的重要性。我从《如何证明它》入手,掌握了逻辑和证明的基础,现在正在学习使用Coq进行简单的逻辑证明。我希望成为区块链领域的形式验证工程师,助力构建更安全的协议。

形式验证及我为何爱上它

DEV Community
DEV Community · 2025-05-17T01:13:54Z

正式语言(如模型检查和形式验证)对我来说是新知识,我希望在此进行简要回顾,以便快速参考。

内存模型与形式化

shrik3
shrik3 · 2025-05-07T16:37:40Z

本文提出了FormalMATH,一个包含5560个经过形式验证的数学问题的大型基准,旨在提升人工智能的形式数学推理能力。研究通过人机协作的自动形式化流程,降低了专业标注成本,并揭示了当前语言模型在形式证明中的局限性,为未来研究指明了方向。

FormalMATH: Benchmarking Formal Mathematical Reasoning of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z

Rust 的不安全特性并不影响其内存安全性。尽管实现中可能包含不安全操作,只要遵循正确的接口和语义,Rust 仍能保持安全。通过形式验证和局部分析,Rust 有效管理不安全代码,确保扩展不会引发问题。

“unsafe”是否会破坏 Rust 的保证?

程序师
程序师 · 2025-03-20T01:57:37Z

VeriPlan系统通过形式验证技术提升了大型语言模型在用户规划中的可靠性和灵活性,解决了传统自动化规划中用户信任不足的问题,显著改善了用户对模型的感知质量和满意度。

VeriPlan: Integrating Formal Verification and Large Language Models into End-User Planning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-25T00:00:00Z

本研究提出了一种基于“这里与那里”逻辑的替代语义,以解决回答集编程中的形式验证挑战,促进逻辑程序的模块化理解,并利用自动定理证明工具验证程序特性,旨在简化ASP验证。

将回答集编程与多排序逻辑联系起来进行形式验证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

该研究提出了工具Marmaragan,利用大型语言模型为程序生成SPARK注释,以实现代码形式验证。实验结果显示其能正确生成50.7%的注释,为未来结合LLM与形式验证奠定基础。

在软件验证背景下验证LLM生成的代码与Ada/SPARK

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了一种自动从系统行为生成规格的方法,解决了形式验证中手动制定规格的挑战与易错性,并比较了不同的LTL规格挖掘技术,对形式方法实践者具有重要指导意义。

What is Formal Verification Without Specifications? A Review on Mining LTL Specifications

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本研究探讨了变换器在自动化形式验证中的应用,通过将研究论文中的形式化证明转化为可验证代码,降低了形式验证的门槛,提高了代码的可靠性与安全性。

From Scientific Text to Verifiable Code: Automating the Process Using Transformers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z
公告:2025年FOSDEM大会Ada开发者房间

2025年2月2日,布鲁塞尔FOSDEM大会将举办Ada开发者房间,介绍Ada语言及其生态系统,主题包括压缩编码、液体类型和形式验证等。

公告:2025年FOSDEM大会Ada开发者房间

DEV Community
DEV Community · 2024-12-20T10:49:52Z

本文探讨了形式验证中对专家知识的需求,并提出了Rango工具,该工具能够自动识别相关前提和相似证明,从而优化合成过程。Rango显著提高了证明的有效性,在多个开源项目中成功合成了32.0%的定理,较之前工具提升了29%。

Rango: An Automated Software Verification Tool with Adaptive Retrieval Enhancement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了AlphaVerus框架,旨在解决自动化代码生成中的形式验证不足问题。通过自我改进的翻译和验证器反馈,AlphaVerus显著提高了生成代码的正确性,并展示了在HumanEval和MBPP等问题上的潜力。

AlphaVerus: Bootstrapping Formally Verified Code Generation through Self-Improving Translation and Tree Refinement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

Cloudflare通过形式验证确保其权威DNS配置的正确性,避免冲突。Topaz系统验证DNS查询的IP地址选择逻辑,确保不同团队的程序不冲突。每当程序更改时,都会通过模型检查器检测潜在错误,从而提高互联网的可靠性,鼓励其他网络运营商采用形式方法。

我们如何通过形式验证防止权威DNS配置中的冲突

The Cloudflare Blog
The Cloudflare Blog · 2024-11-08T14:00:00Z

本文探讨了神经网络的形式验证方法,包括针对分段线性激活函数的前向神经网络验证、二值化神经网络的硬件验证、深度学习模型的统一验证框架,以及新型符号推理框架的提出。研究强调了机器学习在交通运输领域的应用及其认证需求,并提出了改进数字表示方法和算法以提高硬件效率。

神经模型检查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文探讨了大型语言模型(LLM)在代码生成中的安全性问题,提出了多种方法以减少生成脆弱代码的风险。研究表明,结合脆弱性约束解码和形式验证工具,可以有效提高代码的安全性和正确性,降低安全漏洞的传播。

通过自我演化实现Rust代码的自动证明生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本文介绍了多个数学和形式验证的基准测试,如ProofNet、miniF2F和DafnyBench,旨在推动自动形式化和定理证明的研究。这些基准测试涵盖数学推理、自然语言处理和神经网络验证等领域,评估不同模型的性能和适应性,强调了改进的必要性和未来研究的潜力。

PutnamBench: 在 Putnam 数学竞赛上评估神经定理证明器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-15T00:00:00Z

本文探讨了基于图的解释和答案集编程(ASP)的证明方法,涉及程序重写、逻辑程序更新、形式验证及其在心理学中的应用。研究表明,新编码方法在复杂性反映上表现良好,并优化了推理过程。

逻辑程序在答案集语义下的非正式语义变体的历史回顾:GL'88、GL'91、GK'14、D-V'12

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码