亚马逊AWS官方博客 ·

Amazon Bedrock 增加了强化微调功能，简化了开发人员构建更智能、更准确的 AI 模型的方式

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

组织在选择AI模型时可选择通用模型或定制高级模型。强化微调技术通过反馈提升模型性能，平均准确率提高66%。Amazon Bedrock自动化此过程，简化开发，支持高质量输出并降低成本，同时保障数据安全，适合多种业务需求。

🎯

🔎

强化微调技术通过反馈机制提升模型性能，平均准确率提高66%。这一点对于希望在特定业务场景中获得更高质量输出的组织尤为重要。相比传统方法，强化微调不需要大量标注数据，降低了开发门槛，使得更多开发人员能够参与到AI模型的定制中。

在使用Amazon Bedrock进行模型定制时，数据安全性是一个重要考量。所有训练数据和定制模型都保留在安全的AWS环境中，支持VPC和AWS KMS加密，确保符合合规要求。这对于处理敏感数据的企业尤为重要，能够有效降低安全风险。

Amazon Bedrock提供七个开箱即用的奖励函数模板，适用于不同的任务类型。这种灵活性使得开发人员可以根据具体需求快速调整模型评估标准，提升了模型定制的效率和效果。选择合适的模板可以显著缩短开发周期。

❓

强化微调技术是一种通过反馈提升模型性能的方法，平均准确率提高66%，不需要大量标注数据集。

Amazon Bedrock 自动化强化微调流程，使开发人员无需深度机器学习知识或大型标签数据集即可使用。

训练数据可以使用现有的 API 日志，或通过上传数据集，无需标注数据集。

强化微调支持基于可验证奖励的强化学习和基于 AI 反馈的强化学习两种方法。

可以通过实时指标监控训练过程，包括奖励分数、损失曲线和准确率的改善情况。

步骤包括访问控制台、选择基础模型、提供训练数据、设置奖励函数和创建作业。

🏷️