本文探讨了多语言模型在道德判断中的表现,发现这些模型编码了道德偏见,但与人类文化差异不完全一致。研究分析了不同语言模型在模棱两可情境下的道德推理能力,结果表明模型的道德判断受提示语言影响,并存在偏见。强调在大型语言模型开发中考虑道德推理的重要性。
本文探讨了大型语言模型(LLMs)在道德推理和价值观识别中的表现,提出了多个框架和数据集以分析其道德偏见。研究发现,LLMs在明确情境中表现一致,但在模棱两可的情况下则显得不确定,并存在西方中心主义的偏见。通过行为经济学框架评估,LLMs的决策行为与人类相似,强调了在开发和评估中考虑道德推理的重要性。
该研究探讨了大型语言模型(如GPT-3)在道德和伦理方面的表现,发现它们在特定提示下会反映出道德偏见。研究提出了评估和对齐这些模型价值观的方法,强调道德推理在AI决策中的重要性,并展示了实验验证模型道德一致性和潜在风险的方式。
文章探讨了讲故事在思维和身份构建中的重要性。通过讲故事,人们能够更好地理解复杂信息,减轻认知负担,并在互动中发现自我。故事不仅反映身份,还积极塑造个体的自我概念,强调其在道德和伦理推理中的关键作用。总之,讲故事是理解人类经验和身份的重要工具。
本文分析了大型语言模型在道德推理中的表现,发现其在不同文化和语言背景下存在显著不一致性。研究提出了新的评估基准,强调道德推理的重要性,并指出模型在责任和安全方面的改进空间。通过对比不同模型,揭示了它们在道德信念和偏见上的差异,呼吁进一步研究以解决这些问题。
本文综述了大型语言模型(LLMs)在推理能力方面的研究进展,分析了其在类比和道德推理中的表现,以及在空间推理中的不足。研究表明,LLMs在推理时依赖表面模式而非真正的推理能力,强调了人类与机器推理之间的关键差异,并提出了提升模型性能的必要性。
本文探讨了道德机器的构建,分析了后果主义、义务论和德性伦理学等道德理论的复杂性,提出了道德可处理性理论(MTT)。研究讨论了人工智能在道德决策中的作用及潜在风险,指出AI在某些方面的道德推理优于人类,强调对生成语言模型的道德指导保护的必要性。
本文探讨了大型语言模型(LLMs)在多项选择题和自然语言生成中的表现,指出其评估方法的局限性和潜在偏见。研究发现,LLMs在决策时表现出类似人类的风险规避行为,但在道德推理中可能偏向经济利益。建议在AI开发中整合更广泛的道德价值,以确保决策不受单一激励驱动。
大型语言模型(LLMs)在推理和决策能力方面存在显著差距,尤其在网络安全应用中表现优于小型开源模型。研究强调道德推理的重要性,并提出SECURE基准测试以评估LLMs在真实场景中的表现。分析显示模型规模和人类反馈对性能提升至关重要,未来研究需关注数据集的多样性及网络安全领域的潜在风险与机遇。
本文介绍了2023年人工智能(AI)在技术性能方面的全面进展,包括视觉常识推理、道德推理、因果推理、音频生成、智能体和强化学习等方面的能力和表现。同时,还介绍了一些新的技术和方法,如提示技巧、微调和闪电解码,以提高AI系统的性能和效率。此外,还提到了AI系统对环境的影响和一些积极的环境保护应用。总体而言,AI在多个领域的性能和能力已经取得了显著的进展。
本文介绍了一种可召集的道德推理任务,通过自我蒸馏方法获得了一个学生模型,用于生成具有改进的有效性、多样性和可推翻性的有争议背景。利用这个模型,提炼了一个高质量的数据集《δ-Rules-of-Thumb》,其中包含 115,000 个高度被人工标注者评价为 85.9% 至 99.8% 的可推翻道德行为的 1.2M 个背景和理由。最终获得了一种明显优于所有中间学生模型的最终学生模型。
该研究提出了一个灵活的框架,利用跨学科研究中建立的道德理论,引导大型语言模型进行道德推理。研究证明了该框架在从道德理论中衍生的数据集上的有效性,并展示了不同道德理论与现有道德数据集之间的一致性。研究还展示了开发可解释的道德判断系统中现有资源的潜力和缺陷。
完成下面两步后,将自动完成登录并继续当前操作。