内容提要
GitHub宣布将使用用户的交互数据(如代码片段和输入)来训练其AI模型,更新将于4月24日生效。用户可以选择退出数据收集。此举引发开发者社区争议,部分人认为选择退出不够方便,且个人用户与企业用户的数据使用存在不平等。GitHub表示此举符合行业惯例,旨在提升模型性能。
关键要点
-
GitHub宣布将使用用户的交互数据(如输入、输出、代码片段等)来训练其AI模型,更新将于4月24日生效。
-
用户可以选择退出数据收集,退出步骤为:进入GitHub账户设置,选择Copilot,决定是否允许数据用于AI模型训练。
-
如果用户之前已选择退出数据收集,则该选择将被保留,Copilot Business和Enterprise用户不受此更新影响。
-
GitHub及其关联公司(包括微软)将能够访问用户的交互数据,数据可能用于开发和改进人工智能和机器学习技术。
-
GitHub将处理七种类型的交互数据,包括用户接受或修改的输出、发送给Copilot的输入、代码上下文、用户编写的评论和文档等。
-
GitHub表示,交互数据的保留时间因使用情况而异,最长可达五年,但通常会更短。
-
开发者社区对此更新反应不一,部分人认为选择退出不够方便,且个人用户与企业用户的数据使用存在不平等。
-
GitHub辩护称,此举符合行业惯例,旨在提升模型性能,帮助模型更好地理解开发工作流程。
延伸问答
GitHub为什么要使用用户的交互数据来训练AI模型?
GitHub表示,此举旨在提升模型性能,帮助模型更好地理解开发工作流程。
用户如何选择退出GitHub的数据收集?
用户可以进入GitHub账户设置,选择Copilot,然后决定是否允许数据用于AI模型训练。
哪些类型的交互数据会被GitHub收集?
GitHub将处理包括用户接受或修改的输出、发送给Copilot的输入、代码上下文等七种类型的交互数据。
GitHub对个人用户和企业用户的数据使用有什么不同?
个人用户的数据可以用于AI模型训练,而企业用户的数据则不受此更新影响,且有不同的协议保护。
GitHub将保留用户交互数据多久?
GitHub表示,交互数据的保留时间因使用情况而异,最长可达五年,但通常会更短。
开发者社区对GitHub这一更新的反应如何?
开发者社区对此更新反应不一,部分人认为选择退出不够方便,且个人用户与企业用户的数据使用存在不平等。