小红花·文摘

QCon AI 纽约 2025：LinkedIn 的 AI 平台扩展

InfoQ ·

005 | 减少 AI 带来的焦虑

LearnData 开源笔记 ·

本研究重新定义了超级对齐的概念，强调人类与人工智能（AI）的共同对齐。通过结合外部监督和内在主动对齐，确保AI系统与人类意图和价值观一致，以实现可持续的共生社会。

Redefining Superalignment: From Weak to Strong Alignment to Human-AI Co-Alignment Towards a Sustainable Symbiotic Society

BriefGPT - AI 论文速递 ·

本研究探讨自主家庭机器人如何理解人类行为中的长期与短期意图，提出了“长期短期意图预测”任务，并开发了相应的模型和数据集，以帮助机器人识别人类意图的不一致性。实验结果表明，该模型能够提升机器人对人类行为的理解和服务智能化水平。

Understanding Long-Term and Short-Term Intentions in Human Daily Behaviors

BriefGPT - AI 论文速递 ·

本研究探讨了人工智能在图形设计中的应用，旨在解决设计解读与创作的挑战。通过AI技术，展示了大型语言模型和多模态方法如何帮助理解设计元素与意图。尽管已有进展，但理解人类意图和保持设计控制仍然面临挑战。

从碎片到整体：基于人工智能的图形设计调查

BriefGPT - AI 论文速递 ·

提示工程：人工智能成功的秘诀

DEV Community ·

本研究提出因果Mob模型，利用大语言模型从新闻中提取人类意图，显著提升了传统人类流动预测模型在非周期性事件中的准确性。

Causal Mob: Causal Human Mobility Prediction of Public Events Based on Large Language Model-Derived Human Intent

BriefGPT - AI 论文速递 ·

本研究探讨了AI与人类意图对齐中的嗅觉感知问题。通过对40名参与者的研究，发现AI在解读嗅觉描述时存在局限性，尤其对某些气味存在偏见，指出了提升人机交互的机会与挑战。

Olfactory AI: Is My 'Spicy' Your 'Spicy'? Exploring Perceptual Alignment Between Large Language Models and Human Olfactory Experiences

BriefGPT - AI 论文速递 ·

本研究探讨了“生成性中介认知”对人类意图和创造力的影响，强调生成性人工智能在提升创造力与风险之间的双重作用。

生成性中介认知与人工智能：与思维事物的思考

BriefGPT - AI 论文速递 ·

研究探讨了大型语言模型（LLMs），特别是OpenAI的ChatGPT系列的可控性。通过OCEAN框架评估模型对定制提示的响应，发现其在“责任心”和“神经质”上表现明显，而“外向性”和“宜人性”有重叠但不同。研究强调了GPT的多功能性和适应能力，同时指出模型能力提升和训练技术不透明的问题，建议进一步完善以符合人类意图。

尝试成为人类：语言模型中随机共情的语言痕迹

BriefGPT - AI 论文速递 ·

探讨关系匹配在大型语言模型中的作用

BriefGPT - AI 论文速递 ·

本文介绍了Intent-based Prompt Calibration（IPC）方法，通过自我学习来增强AI系统的能力，提供更准确和有帮助的回应，弥合人类意图和机器解释之间的鸿沟，使AI与人的交互更加自然高效。这对使用AI工具的人有价值，对技术领域的专业人士是了解前沿AI研究的窗口，对其他人是了解AI人性化的机会。

研究人员如何教AI理解我们的真实需求

DEV Community ·

本研究介绍了对LLM值得信赖性评估的关键维度，包括可靠性、安全性、公平性、抵抗滥用性、可解释性和推理性、遵守社会规范以及鲁棒性。研究结果显示，符合人类意图的模型在整体可信度方面表现更好，但对不同可信度类别的影响程度不同。强调了对LLM对齐进行细致分析、测试和改进的重要性。该研究为从业人员提供了有价值的见解和指导，实现可靠和符合伦理的LLM部署至关重要。

LLM-CI：评估语言模型中的上下文完整性规范

BriefGPT - AI 论文速递 ·

Legilimens：大型语言模型服务的实用统一内容审查

BriefGPT - AI 论文速递 ·

本研究评估大型语言模型（LLM）的可信度，关键维度包括可靠性、安全性、公平性、抵抗滥用性、可解释性和推理性、遵守社会规范以及鲁棒性。结果表明，符合人类意图的模型表现更好，但对不同可信度类别的影响程度不同，需要进行更加细致的分析、测试和改进。该研究为从业人员提供有价值的见解和指导，实现可靠和符合伦理的LLM部署至关重要。

大型语言模型对齐：一项调查

BriefGPT - AI 论文速递 ·