该文章讨论了在rust-lang/rust GitHub项目中添加大型语言模型(LLM)政策的提议,主要包括禁止评论LLM的社会经济影响、环境影响、版权状态及道德判断。管理团队将协助执行这些规则。
《公正》探讨了功利主义、义务论和契约论等正义理论。桑德尔强调道德判断应结合具体情境,认为个体生活在社群中,正义需关注个体权利与社会责任。书中通过经典案例分析不同理论的应用,值得深入阅读。
随着人工智能的普及,依赖情感、信任和道德判断的职业价值将上升,尤其是领导力、导师和谈判等领域。人类的软技能将成为稀缺资源,AI难以替代这些工作。
本研究探讨了大型语言模型(LLMs)在道德判断中的评估,指出现有方法简化了复杂的道德困境。通过分析“AITA”社区的案例,发现LLMs的道德判断与人类显著不同,强调了在人工系统中实施一致道德推理的复杂性,提醒我们需谨慎评估其道德决策。
本研究提出了“ClarityEthic”方法,旨在提高大型语言模型在道德判断中的可靠性和可解释性。通过对比学习识别适用的社会规范,该方法提升了道德判断的准确性和解释能力。实验结果表明,该方法优于现有技术,并获得积极反馈,显示出改善伦理行为的潜力。
欧盟人工智能法案已生效,强调负责任地开发和使用AI系统。文章探讨机器伦理及其自我意识和道德判断能力,指出机器学习可能反映人类数据中的偏见。以德尔菲聊天机器人为例,讨论机器应遵循的人类价值观。未来需确保数据训练的多样性,促进透明度和问责制,以实现全球伦理一致性。
本文探讨了多语言模型在道德判断中的表现,发现这些模型编码了道德偏见,但与人类文化差异不完全一致。研究分析了不同语言模型在模棱两可情境下的道德推理能力,结果表明模型的道德判断受提示语言影响,并存在偏见。强调在大型语言模型开发中考虑道德推理的重要性。
本研究探讨了大型语言模型(如GPT-3.5和GPT-4)在法律推理和文书起草中的能力。结果显示,模型在法律推理方面较弱,但在法律文书起草上表现良好。尽管无法替代律师,模型仍能降低法律服务成本,促进司法公正。研究还指出模型在道德判断和偏见方面的表现差异,强调领域专业知识在模型训练中的重要性。
本文探讨大型语言模型(LLMs)在因果和道德判断方面与人类的相符度。研究发现,尽管模型的判断能力有所提高,但在不同因素的重视程度上仍存在差异。此外,预训练的多语言模型可能编码道德偏见,这些偏见不一定反映人类文化的差异。研究强调了多语言预训练数据集的重要性,以更好地代表人类经验的多样性。
本文介绍了BiasBuster框架,旨在识别和减轻大型语言模型中的认知偏见。通过开发包含16800个提示的数据集,研究了多种去偏见策略,验证了自助去偏置方法的有效性。同时,探讨了大型语言模型在道德判断和金融决策等领域的表现,强调了其在模拟人类行为时的局限性和潜在风险。
本研究探讨了大型语言模型(LLMs)在多种语言中的道德判断和推理能力,发现印地语和斯瓦希里语的表现较差,且存在对西方价值观的偏见。强调在AI开发中需整合多元道德价值,以避免单一经济驱动的决策风险。
本文探讨了大型语言模型在价值观理解和道德判断方面的局限性,指出其存在西方中心主义偏见和对非西方国家的误解。研究提出了新的评估方法,以提高AI系统与人类价值观的一致性,并强调跨学科合作在应对AI伦理挑战中的重要性。
该研究探讨了机器学习在道德和伦理判断中的应用,特别是BERT模型的有效性。通过分析社交媒体文本,微调后的模型在道德分类任务中显著提高了性能。研究还提出结合文本特征和外部知识库的方法,以更准确地检测道德价值表达,并探讨文化知识在道德推断中的重要性。
研究发现,Chat-GPT语言模型的神经活动拓扑结构对公平性的度量标准有影响。GPT-3.5的句子嵌入可以分解为公平和不公平道德判断对应的两个子流形,表明GPT在训练过程中对公平性有了理解。
本文测试了大型语言模型对文本场景进行的因果和道德判断是否与人类参与者的判断相符。结果显示,大型语言模型与人类的判断相符度有所提高,但对不同因素的重视程度存在明显差异。这些结果揭示了大型语言模型的隐含倾向,并展示了这些倾向在多大程度上与人类的直觉相一致。
研究社交媒体对道德判断的影响因素,包括事件和语言信号。负面个人特质和描绘会影响道德判断。
完成下面两步后,将自动完成登录并继续当前操作。