谷歌推出了一种新一代的开放模型Gemma,它们轻巧且专为负责任的AI开发而构建。Gemma模型有两种规模,2B和7B,并配备了一个负责任的生成AI工具包。这些模型可以与JAX、PyTorch和TensorFlow等主要框架一起使用,并与Hugging Face和MaxText等流行工具兼容。Gemma模型可以在包括NVIDIA GPU和Google Cloud TPU在内的各种硬件平台上运行。它们的设计优先考虑安全和负责任的行为,过滤个人信息并进行广泛评估。谷歌还发布了一个负责任的生成AI工具包,以帮助开发人员构建安全的AI应用程序。Gemma模型可以进行微调和优化以满足特定需求,并支持不同设备。谷歌为开发人员和研究人员提供免费访问Gemma,并提供研究和开发的积分。
该研究提出了一种用于强化学习智能体的安全行为的框架,通过专家策略的演示来优化智能体的行为。实验证明该算法在离散和连续问题中表现良好。
完成下面两步后,将自动完成登录并继续当前操作。