本研究探讨大型语言模型(LLMs)是否能够模拟人类的伦理推理。通过评估196个伦理困境,结果显示LLMs在一致性方面优于非专家人类,但在历史背景和微妙策略的理解上仍存在局限,揭示了其优势与不足。
本研究提出了一种新的多道德马尔可夫决策过程模型,以解决机器伦理决策中的不确定性问题,并通过多目标AO*启发式算法验证了在不确定条件下的伦理推理方法。
本研究评估了大型语言模型(LLMs)的伦理推理能力,发现其在关怀/伤害和公平/欺骗方面表现一致,但对权威、忠诚和神圣等维度重视不足。这为人工智能的伦理基准提供了方法论,突显了其潜力与局限性。
本文提出了一个五维审计模型,用于评估生成性人工智能模型在关键领域应用中的伦理推理。研究发现,尽管模型在伦理决策上趋向一致,但在解释严谨性和道德优先级上存在差异,强调了AI在复杂决策中补充人类道德推理的潜力。
本研究分析了六个生成性大型语言模型在道德困境中的伦理推理表现,发现它们在伦理逻辑上保持一致,主要侧重于理性和结果导向,但在微调和后训练方面存在显著差异。
本文提出了一种结合文本特征与外部知识库的新方法,用于检测推文中的道德价值表达。研究开发了MoralStrength词汇表,展示了其在道德预测中的优越性。通过混合神经符号技术,增强了大型语言模型在伦理推理中的有效性,并探索了无监督道德价值检测的最新模型。
本研究探讨了语言模型在伦理模糊情境中与人类判断的不匹配,指出现有模型的局限性。通过精细调优,模型在复杂道德决策中的理解能力显著提升,更好地对齐人类判断,强调了研究伦理推理技术的必要性。
该研究探讨了大型语言模型在医疗领域的偏见与不准确性问题。通过引入BiasMD和DiseaseMatcher数据集,开发了EthiClinician模型,提升了伦理推理和临床判断能力,从而提高了AI在医疗中的安全性与可靠性,改善了患者的诊断结果。
本文概述了自进化方法在大型语言模型(LLMs)中的应用,探讨了训练框架、目标及挑战。通过自我进化和语言反馈,LLMs在视觉程序合成和伦理推理等领域展现出卓越的适应能力。研究提出利用混合神经符号技术和自省式提示来提升模型的逻辑有效性和决策性能,显示出在多个基准测试中的潜力。
本文探讨了利用大型语言模型生成和解释线性时态逻辑(LTL)公式的方法,旨在减少对人工数据的依赖,提高自然语言命令的翻译准确率。研究提出了多种算法和框架,增强了模型在伦理推理和法律系统中的应用,提升了解释质量和可访问性。
完成下面两步后,将自动完成登录并继续当前操作。