小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI Agent 安全与信任机制:2026 年形式化验证与 GDPR 合规

本文探讨了2026年AI Agent的安全与信任机制,强调在权限、隐私与合规之间的平衡。随着AI Agent自主决策能力的提升,传统安全模型面临挑战,需采用动态权限管理和零信任架构。OWASP发布的十大风险框架为安全设计提供指导,强调权限分级、隐私保护和合规性的重要性。未来,技术与法规的演进将推动安全机制的持续改进与适应。

AI Agent 安全与信任机制:2026 年形式化验证与 GDPR 合规

Micropaper
Micropaper · 2026-04-11T23:37:00Z

名为Gauss的AI在三周内完成了陶哲轩和Kontorovich提出的数学挑战,远超他们18个月的进展。该AI能自动形式化数学内容,生成约25000行Lean代码,未来计划提升形式化代码量100到1000倍,推动数学项目进展。

啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

量子位
量子位 · 2025-09-14T05:22:21Z

字节跳动与南京大学联合推出的CriticLean框架,将数学自然语言转化为Lean 4代码的准确率从38%提升至84%。该框架通过强化学习和评估模型,解决了数学形式化中的语义对齐和评价可靠性问题,显著增强了自动化定理证明能力。

超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源

量子位
量子位 · 2025-07-31T00:21:32Z

我们正在训练AI模型,需要提供20-50条verus训练数据,以提高代码输出效率和准确性。欢迎投简历,联系方式:764586552@qq.com,期待长期合作。

verus形式化程序验证兼职招募

Rust.cc
Rust.cc · 2025-06-19T08:01:34Z

文章讨论了AI在数学推理和形式化证明方面的最新进展,特别是大模型的能力。5月29日将举行直播,邀请多个项目团队成员探讨AI数学的未来及其影响。

形式化证明与大模型:共创可验证的AI数学未来|量子位直播

量子位
量子位 · 2025-05-27T03:25:24Z

Rust 编程语言在过去十年中因其内存安全性和高效性而受到开发者青睐。Niko 的文档探讨了 const Trait 的设计,xd009642 介绍了性能优化,Steven Vaughan-Nichols 讲述了 Rust 的起源与发展。

【Rust日报】2025-05-22 Niko 的 const Trait 形式化模型和语法设计

Rust.cc
Rust.cc · 2025-05-21T23:50:10Z

本文介绍了高质量基准数据集CLEVER,包含161个专注于代码生成验证的问题。CLEVER避免了测试用例监督,确保输出通过Lean类型检查器验证,揭示了程序合成和形式推理的挑战。

CLEVER:一个经过精心策划的形式化验证代码生成基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究旨在解决机器学习中缺乏统一理论框架及可解释性和伦理安全保障不足的问题。通过构建形式信息模型,提出机器学习理论的元框架(MLT-MF),并定义模型可解释性和伦理安全,为解决相关挑战提供理论基础。

机器学习的信息科学原理:基于形式化信息映射的因果链元框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了PDDLego+框架,旨在解决部分可观察环境中的规划问题,实现零样本迭代形式化和规划,展现出优越的性能和鲁棒性。

零样本迭代化形式化和规划在部分可观察环境中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频

机器之心
机器之心 · 2025-05-11T13:05:06Z

FormalMATH发布了5560道数学题的基准测试,以评估AI模型的数学推理能力。最佳模型的成功率仅为16.46%,显示出在严格逻辑推导方面的困难。研究团队提出了自动化流程以提高效率,并呼吁学术界共同推动形式化数学推理技术的发展。

挑战AI数学推理极限!大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%

量子位
量子位 · 2025-05-08T00:59:09Z

正式语言(如模型检查和形式验证)对我来说是新知识,我希望在此进行简要回顾,以便快速参考。

内存模型与形式化

shrik3
shrik3 · 2025-05-07T16:37:40Z
DeepSeek-Prover-V2:形式化数学推理的范式突破

形式化定理证明在数学中至关重要,但面临人类认知和机器可解释性挑战。DeepSeek-Prover-V2通过神经定理证明技术,提升了形式化推理能力,达到了88.9%的通过率,标志着数学智能的新纪元。该模型采用递归子目标分解和强化学习,显著提高了证明效率,未来有望解决更复杂的数学问题。

DeepSeek-Prover-V2:形式化数学推理的范式突破

我爱自然语言处理
我爱自然语言处理 · 2025-05-01T23:16:17Z
7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!

由香港科技大学等单位组成的研究团队开源了一系列形式化推理与验证的大模型,使用7B参数实现与671B DeepSeek-R1相当的性能。研究指出,形式化验证的普及受限于高门槛和人力成本,而大模型在语义理解和代码生成方面的优势有望加速验证流程。经过微调,模型在形式化任务上的表现显著提升,且对数学和推理任务也有积极影响。

7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!

机器之心
机器之心 · 2025-03-08T07:46:41Z

本研究探讨大型语言模型在形式化复杂数学定义中的局限性,并提出来自维基百科和arXiv的新资源。研究表明,数学定义的形式化难度较大,但通过外部反馈和引导策略,LLMs的自我修正能力显著提升,为实际应用开辟了新方向。

利用大型语言模型(LLMs)形式化复杂数学陈述:关于数学定义的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本文研究了自然语言数学与机器可验证的形式语言配对数据稀缺的问题,提出了ATLAS框架,通过迭代数据生成来生产高质量的平行定理陈述。在经过10次迭代后,ATLAS构建了一个包含30万条定理的本科生级别数据集,并在定理翻译中取得了显著提高的准确率,推动了自动形式化的前沿研究。

ATLAS:通过数据提升、增强和合成实现定理的自动形式化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-08T00:00:00Z
医学基础的计算形式化探索

医学理论探讨了医学的基本特征,强调通过计算模型研究疾病与治疗。理想生物体在无干扰时正常运作,干扰导致“疾病”。医学的核心在于识别干扰并找到有效治疗。尽管计算的复杂性使预测和治疗困难,但机器学习等方法可能实现更精准的治疗。整体上,医学基础体现了计算范式。

医学基础的计算形式化探索

Stephen Wolfram Writings
Stephen Wolfram Writings · 2025-02-03T23:27:46Z

本研究解决了大型语言模型在代码生成和逻辑推理任务中存在的显著令牌效率瓶颈问题。我们提出了一种基于符号压缩的形式化框架,通过结合组合逻辑、信息论最优编码和上下文感知推理技术,实现了令牌效率的显著提升并保留语义完整性。实验结果表明,该方法在代码生成任务中实现了78.3%的令牌压缩率,并提升了62%的逻辑可追溯性,为大型语言模型的高效推理提供了新的理论工具。

通过符号压缩提升大型语言模型效率:朝向可解释性的形式化方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

本文提出了一种新方法,用于形式化验证机器学习模型参数的马尔可夫过程属性。研究将属性验证转化为双线性规划,并开发了高效的求解方法,实验证明其速度比现有最佳求解器快100倍,可能改变医疗建模等领域的概率程序验证方式。

使用学习参数的马尔可夫过程的形式化验证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本研究针对人类与大型语言模型(LLMs)之间合作的有效性问题,提出了一种新的分类法来总结现有方法,旨在为未来的突破性研究奠定基础。研究表明,随着智能模型从简单工具演变为具有自主目标的合作代理,推动了NLP任务的显著进展,同时也揭示了亟待解决的挑战。

如何促进人类与自然语言处理模型之间的有效合作:原则、形式化及其进一步发展综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码