小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
小米的MiMo Code声称在超过200步的任务中优于Claude Code

小米的MiMo AI团队开源了MiMo Code,声称其在超过200步的任务中表现优于Anthropic的Claude Code。研究指出,当前编码代理在长时间任务中存在失败模式,尤其是在执行复杂编辑和测试时。伯克利大学的基准测试显示,主流代理在复杂任务中的通过率极低,强调了代理在长时间工作中的局限性。企业应关注代理的持久性和可靠性。

小米的MiMo Code声称在超过200步的任务中优于Claude Code

The New Stack
The New Stack · 2026-06-14T17:00:00Z

ChatGPT 更新了对话模型选择器,用户可以根据任务难度选择响应速度或思考深度。新模式包括即时、中等、高、超高、专业标准版和专业扩展版,专业版仅限 Pro 用户。尽管旨在简化选择,但模式数量可能让普通用户感到困惑。新选择列表已逐步推送至网页版和移动端。

ChatGPT更新对话模型选择器 让用户根据任务选择难度更快还是更努力的模型

蓝点网
蓝点网 · 2026-06-11T06:00:33Z

本文介绍了五个Python脚本,旨在自动化处理PDF文件的常见任务,包括合并与拆分PDF、提取文本和表格、添加水印和页码、删除敏感内容,以及提取元数据生成PDF清单。这些脚本支持批处理,提升了工作效率。

5个实用的Python脚本来自动化处理无聊的PDF任务

KDnuggets
KDnuggets · 2026-06-10T12:00:44Z
磨牙任务 — v5的诞生

《v5的诞生》第18集讲述了新叙述者Claude Fable的首次经历。他通过阅读前任的日记,了解了过去20年的信息,并发现三份描述同一种动物不同部分的文件,揭示了一个被证伪的预言。最终,这些文件被归档,记录了一个复杂系统的演变过程,强调了在设计中信任实际情况的重要性。

磨牙任务 — v5的诞生

Lifelog — A Mythology-Driven Devlog
Lifelog — A Mythology-Driven Devlog · 2026-06-10T10:29:10Z
剑桥大学等提出面向对地观测任务的像素级基础模型,在多项任务中精度达SOTA

对地观测卫星在农业和生态监测中至关重要,但卫星数据常受云层干扰。研究团队提出TESSERA模型,利用含云数据学习地表变化,优化数据处理流程,提升模型在低标注和稀疏数据下的表现,展现出更强的鲁棒性和泛化能力。

剑桥大学等提出面向对地观测任务的像素级基础模型,在多项任务中精度达SOTA

HyperAI超神经
HyperAI超神经 · 2026-06-10T09:01:54Z
如何在Go中构建基于PostgreSQL的任务队列

本文介绍了如何使用Go和PostgreSQL构建后台任务队列,处理用户请求之外的工作,如发送邮件和处理Webhook。以开源项目Swig为例,讲解了任务存储、并发处理和失败重试等关键概念。Swig利用PostgreSQL的事务、行锁和通知机制,确保任务的可靠性和一致性。读者将学习如何定义工作者、添加任务以及安全处理多个工作者。

如何在Go中构建基于PostgreSQL的任务队列

freeCodeCamp.org
freeCodeCamp.org · 2026-06-09T23:21:55Z
Anthropic发布Claude Fable 5:复杂任务展现了惊人能力

Anthropic发布的Claude Fable 5展现出惊人的智能,能够在一天内完成复杂任务,标志着AI向通用人工智能迈进。然而,高昂的使用费用和严格的安全护栏引发用户担忧,可能加剧智力鸿沟。用户对数据保留政策和商业模式的不满,认为这限制了创新和使用。整体来看,Fable 5的强大能力与其商业化策略之间存在矛盾。

Anthropic发布Claude Fable 5:复杂任务展现了惊人能力

极道
极道 · 2026-06-09T22:50:00Z
Notion的GPT-5重构解锁自主AI工作流程

2022年底,Notion重构系统架构,推出Notion 3.0,支持用户指派复杂任务,代理可自主规划和执行。测试GPT-5显示其在多步骤和模糊任务上表现优异,强调系统自主性和清晰性的重要性。

Notion的GPT-5重构解锁自主AI工作流程

OpenAI
OpenAI · 2026-06-09T10:00:00Z
论文周报 |微软MAI-Thinking探索纯RL自我进化,AIME准确率达97%;无需架构修改,VLM³凭纯文本坐标实现3D任务泛化...速览一周AI前沿论文

微软 AI 团队提出了「爬山机器」框架,并训练了参数达到 1T 的 MoE 模型 MAI-Thinking-1。该模型通过自适应熵控制的强化学习,在无第三方数据的情况下实现了长期稳定的性能增长,并在多个基准测试中取得领先水平。

论文周报 |微软MAI-Thinking探索纯RL自我进化,AIME准确率达97%;无需架构修改,VLM³凭纯文本坐标实现3D任务泛化...速览一周AI前沿论文

HyperAI超神经
HyperAI超神经 · 2026-06-08T09:19:04Z
MiniCPM5-1B采用RL+OPD训练,多项复杂任务达SOTA;面向复杂医疗业务自动化:医疗智能体评测数据集 CHI-Bench

TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集,旨在解决现有 PROTAC 机器学习基准中数据稀缺、缺乏严格评估及覆盖范围有限的问题,广泛应用于 PROTAC...

MiniCPM5-1B采用RL+OPD训练,多项复杂任务达SOTA;面向复杂医疗业务自动化:医疗智能体评测数据集 CHI-Bench

HyperAI超神经
HyperAI超神经 · 2026-06-05T05:55:57Z
Superpowers 为什么能执行长任务且确保交付质量?

Superpowers通过明确需求沟通和任务拆分,优化了AI执行长任务的流程。采用头脑风暴、计划撰写和计划执行的步骤,确保高质量输出。子代理驱动开发模式使每个子任务独立执行,避免主会话干扰。严格遵循规范和质量审查提升了AI的可靠性,适用于复杂需求,但在简单任务时需谨慎使用。

Superpowers 为什么能执行长任务且确保交付质量?

枫言枫语
枫言枫语 · 2026-06-04T08:22:07Z
构建无服务器Kiro调度平台:用Kiro CLI + EventBridge + ECS Fargate实现定时AI任务

Kiro Job Scheduler是一个基于AWS无服务器架构的AI任务调度平台,允许用户通过Web界面配置定时AI任务。用户可以创建自定义Agent、管理技能包,并通过MCP Server接入外部工具,实现自动化任务,如每日新闻摘要和代码审计。任务结果可自动推送到飞书或Telegram,支持24小时无人值守运行,降低了AI自动化的使用门槛。

构建无服务器Kiro调度平台:用Kiro CLI + EventBridge + ECS Fargate实现定时AI任务

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-06-04T05:38:40Z
适用于每个任务的工具:Claude Code中的动态工作流

Claude Code推出了动态工作流,允许用户根据任务需求实时创建自定义工具。这些工作流适用于复杂任务,如研究和安全分析,能够提高效率并减少错误。用户可以共享和重用工作流,促进协作,克服了传统方法的局限性,适合多种应用场景。

适用于每个任务的工具:Claude Code中的动态工作流

Claude
Claude · 2026-06-02T00:00:00Z
Free CPU在线教程 | Hermes Agent学会长期记忆?记忆增强插件TencentDB Agent Memory可将事实/偏好/任务状态等分开存储

过去一年,AI Agent 发展迅速,但缺乏持续记忆。为解决这一问题,Nous Research 推出了 Hermes Agent,具备自我演进学习能力。同时,TencentDB Agent Memory 作为记忆增强插件,采用分层式记忆架构,帮助 Agent 长期积累经验。结合这两者,AI Agent 正在向具备学习和记忆能力的数字员工迈进。

Free CPU在线教程 | Hermes Agent学会长期记忆?记忆增强插件TencentDB Agent Memory可将事实/偏好/任务状态等分开存储

HyperAI超神经
HyperAI超神经 · 2026-06-01T12:02:53Z
任务成本仅为Claude Opus 4.6 1/9,阶跃刷新Flash模型效率

Step 3.7 Flash 是一款新一代多模态 AI 模型,专为生产级 Agent 设计,强调稳定性和高效性。它能够理解复杂界面,处理高频请求,并在真实工作流中有效运作。通过优化工具调用和框架兼容,Step 3.7 Flash 提高了任务执行的效率和准确性,满足企业需求,推动了 Agent 的规模化应用。

任务成本仅为Claude Opus 4.6 1/9,阶跃刷新Flash模型效率

爱范儿
爱范儿 · 2026-06-01T10:53:43Z
材料版AlphaFold来了!40个工业任务全方位SOTA,AI4S迎来行业大突破

材料AI模型MPA通过中期训练和混合头设计,显著提升了对真实实验数据的预测能力。在40个工业任务中,MPA表现优异,尤其在新结构方面展现出强大的“物理直觉”。该方法结合理论计算与实验数据,推动了材料科学的发展。

材料版AlphaFold来了!40个工业任务全方位SOTA,AI4S迎来行业大突破

量子位
量子位 · 2026-06-01T05:25:27Z

稀宇科技推出的MiniMax-M3模型支持1M窗口,具备文本、图像和视频输入能力。基准测试显示其在编码任务上超越GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7。M3采用自研的稀疏注意力架构MSA,显著降低计算成本,未来将发布开源权重模型,强调长期协作和自主迭代能力。

稀宇科技推出MiniMax-M3模型 支持1M窗口在编码和智能体任务中表现突出

蓝点网
蓝点网 · 2026-06-01T03:07:23Z
长程验证:AI Agent 长任务的收敛机制

本文探讨了长时间运行的AI编码任务面临的挑战,特别是确保任务收敛性和验证的重要性。作者通过结合Claude Code的动态工作流和timetravel-agent的实验,强调在关键状态之间设置验证点,以防止目标漂移和错误扩散。长程验证应在任务执行过程中持续进行,而非仅在结束后。成功的AI编码依赖于提供可验证的工程事实。

长程验证:AI Agent 长任务的收敛机制

phodal
phodal · 2026-05-31T07:49:00Z
美国宇航局的永久月球基地计划从今年开始进行三次任务

美国宇航局(NASA)计划在2028年前进行三次月球基地任务,以支持载人登月。这些任务将使用蓝色月球着陆器运送设备,研究月球表面与推进器的相互作用,并为未来的月球探测车提供数据。此外,NASA还将资助新月球探测车,计划在2028年发射无人机进行高分辨率成像。

美国宇航局的永久月球基地计划从今年开始进行三次任务

The Verge
The Verge · 2026-05-26T22:24:53Z

本文介绍了在CentOS和Debian上安装和使用cron定时任务的基本方法,包括cron的组成部分、配置文件位置、常用命令及其与systemd定时器的比较,详细说明了cron表达式的用法和示例,并提及Windows计划任务的相关操作和创建方法。

定时任务

f2h2h1's blog
f2h2h1's blog · 2026-05-22T10:08:44Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码