Microsoft 365 Developer Blog ·

宣布Microsoft 365 Copilot代理评估工具的公开预览版

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

微软今天发布了Microsoft 365 Copilot代理评估工具的公开预览版。该工具帮助开发者评估和提升为Microsoft 365 Copilot构建的代理质量，支持通过命令行界面发送提示、捕获响应并评分，生成结构化报告，以便在开发和CI/CD流程中使用。旨在实现客观、可重复的评估，满足客户对代理准确性和一致性的期望。

🎯

关键要点

微软发布了Microsoft 365 Copilot代理评估工具的公开预览版。
该工具帮助开发者评估和提升为Microsoft 365 Copilot构建的代理质量。
工具提供命令行界面，支持发送提示、捕获响应并评分，生成结构化报告。
旨在实现客观、可重复的评估，满足客户对代理准确性和一致性的期望。
公开预览版支持单轮或多轮对话的评估，测试代理的上下文保持和任务完成能力。
评估结果以HTML评分卡报告的形式输出，便于开发者共享和使用。
使用该工具需要Microsoft 365 Copilot许可证和Azure OpenAI端点。

🔎

延伸解读

工具的实用性与开发流程的整合

Microsoft 365 Copilot代理评估工具通过命令行界面简化了评估流程，使开发者能够在现有的开发环境中轻松集成。该工具不仅支持单轮和多轮对话的评估，还能自动生成结构化报告，便于开发者在CI/CD流程中使用。这种整合有助于提高开发效率，确保代理的质量符合客户期望。

评估标准的重要性

随着代理从演示转向实际业务工作流，客户对代理的准确性和一致性要求越来越高。使用Microsoft 365 Copilot代理评估工具，开发者可以实现客观、可重复的评估，确保代理在真实场景中的表现。这种评估框架不仅提升了代理的质量，也为开发者提供了可靠的反馈机制。

使用前的准备工作

在使用Microsoft 365 Copilot代理评估工具之前，开发者需要确保具备相应的许可证和环境配置，包括Azure OpenAI端点和Node.js版本要求。这些准备工作是确保工具顺利运行的基础，开发者应提前与管理员沟通，确保环境的正确设置。

❓

延伸问答

Microsoft 365 Copilot代理评估工具的主要功能是什么？

该工具帮助开发者评估和提升为Microsoft 365 Copilot构建的代理质量，支持发送提示、捕获响应并评分，生成结构化报告。

如何使用Microsoft 365 Copilot代理评估工具进行评估？

开发者可以通过命令行界面选择代理进行评估，支持单轮或多轮对话的测试，评估结果以HTML评分卡报告的形式输出。

使用Microsoft 365 Copilot代理评估工具需要哪些条件？

需要Microsoft 365 Copilot许可证、已部署的代理、Node.js 24.12.0+、管理员同意在租户中运行工具，以及Azure OpenAI端点。

Microsoft 365 Copilot代理评估工具的公开预览版有什么特点？

公开预览版提供完整的评估循环，支持与Microsoft 365开发者的工作流程自然结合，便于测试代理的上下文保持和任务完成能力。

为什么评估代理的质量对开发者来说很重要？

随着代理从演示转向核心业务工作流，客户期望代理在准确性和一致性上达到更高标准，评估框架可以确保这一目标的实现。

评估结果如何呈现给开发者？

评估结果以HTML评分卡报告的形式输出，便于开发者共享和使用，捕捉代理质量的客观证据。

🏷️