小红花·文摘

研究发现大型语言模型可以生成新颖的研究想法，增强人类创造力

DEV Community ·

FutureHouse Inc.发布了LAB-Bench生物学基准数据集，用于评估人工智能系统在各种生物研究任务中的性能。数据集包括2400多个多项选择题，涵盖文献检索、图表解释、表格解释、数据库访问、协议编写以及DNA和蛋白质序列的理解和处理等主题。研究人员评估了不同模型在文献回忆、补充材料信息检索以及表格和协议数据解释等任务中的表现。结果显示，虽然模型在某些任务中表现良好，但在需要DNA和蛋白质序列处理的任务中表现较差。总体而言，人类在实际研究任务中的表现仍然优于模型。

全新生物学基准数据集LAB-Bench震撼开源！覆盖8大任务，超2.4K选择题

HyperAI超神经 ·

推特因用户数据被用于训练人工智能系统面临欧洲监管机构质询。Chrome要求输入ZIP归档密码以检测恶意文件。IDC预测2023年中国托管安全服务市场规模为46.1亿元。黑客窃取并公开了CrowdStrike的IoC数据。发布了人脸识别产业法律治理研究报告。

FreeBuf早报 | 欧洲中央银行完成银行业网络压力测试；黎巴嫩卫生部数据泄露

FreeBuf网络安全行业门户 ·

未来的人工智能系统将具备更强的自适应学习能力，并能在物理世界中执行任务和作出反应。AI伦理问题将受到挑战，需要建立人工智能治理框架和监管技术。软件开发者角色可能会演变，开发者将更多地承担监督和管理的职能。软件开发行业可能会民主化，更多没有传统技能的人也可以参与软件开发。

面向AI的开发：从大模型（LLM）、检索增强生成（RAG）到智能体（Agent）的应用

京东科技开发者 ·

苹果推出了人工智能系统ReALM，能够理解屏幕上的任务、会话上下文和后台进程，通过将屏幕信息转换为文本实现更高效的人工智能。研究人员表示，ReALM的性能优于GPT-4。该系统使得语音助手更具情境感知能力，提供更无缝和免提的用户体验。

苹果推新AI：ReALM

极道 ·

海关与边境保护局希望使用人工智能在边境扫描芬太尼

The Verge ·

本文讨论了算法性辞职，一种在组织中管理使用人工智能系统的策略性方法。通过将治理机制直接嵌入到人工智能系统中，在某些情况下有意识且经过明确了解地与人工智能辅助工具脱钩。算法性辞职不仅可以减轻与人工智能相关的风险，而且可以确保人工智能系统的负责任和有效使用。

算法何时应辞职？

BriefGPT - AI 论文速递 ·

本文介绍了一种新的形式化方法来量化人工智能系统与人类价值观的一致性，使用马尔可夫决策过程作为基础模型。该方法可评估规范与价值观的一致程度，确保AI系统与人类价值观和谐共处。适用于幸福推荐系统和安全自动驾驶车辆等应用领域。

混合参与式系统中的价值偏好估计和消歧

BriefGPT - AI 论文速递 ·

本研究旨在利用人工智能系统提高紧急科室医生的诊断效率和准确性。通过开发基准测试MIMIC-ED-Assist评估AI系统在建议实验室检查方面的能力，同时减少等待时间和正确预测重要结果。研发的ED-Copilot通过预训练的生物医学语言模型编码患者信息和强化学习算法，提高了预测准确性，并将平均等待时间从4小时减少到2小时。

ED-Copilot：运用语言模型诊断辅助降低急诊等待时间

BriefGPT - AI 论文速递 ·

本文讨论了多维目标无法归约时的困难性，并提出了使用不确定性目标作为替代方案。证明了不可能结果所蕴含的不确定度下限，并提出了关于不确定目标与人工智能系统的猜想。

代理人无需了解其目的

BriefGPT - AI 论文速递 ·

通过研究23个最先进的LLM基准，发现了限制，并强调了标准化方法、监管确定性和伦理指南的迫切需求，以及发展被广泛接受的基准和增强人工智能系统融入社会的重要性。

生成人工智能时代下的大型语言模型评估标准的不足

BriefGPT - AI 论文速递 ·

未来战争需要更复杂、快节奏、结构模糊和苛刻的指挥与控制决策。人工智能系统与人类合作的愿景可以简化操作流程、保持统一性并发展集体知识系统。文章讨论了构建假设和提议的发展如何改变未来战争中的指挥与控制。

使用强化学习发现 Tor 和公共网络上的指挥和控制（C2）通道

BriefGPT - AI 论文速递 ·

美国专利局确认AI不能持有专利

The Verge ·

人工智能系统在临床实践中有潜力革新，但需要解决偏见问题。调查了生物医学领域中应用的偏见处理方法，并讨论了优势和弱点。同时回顾了其他潜在方法。

应对生物医学中人工智能公平性和偏见的最新方法调查

BriefGPT - AI 论文速递 ·

人工智能系统实现自主和通用行为的关键是理解和应用结构化知识表示方法，通过交互对象学习可转移的互动概念和泛化的元认知普适框架。强化学习与KIX整合知识，推动人工智能系统实现自主和通用行为。

KIX: 一种元认知泛化框架

BriefGPT - AI 论文速递 ·

本文介绍了一种新的形式化方法来量化人工智能系统与人类价值观的一致性，使用马尔可夫决策过程作为基础模型。该方法可以帮助评估规范与价值观之间的一致程度，并在规范世界中评估状态转换中的偏好变化。这种方法可以帮助AI开发者和伦理学家更好地设计和评估AI系统，以确保其与人类价值观和谐共处。

多元一致性路线图

BriefGPT - AI 论文速递 ·

该论文介绍了一种名为“元提示”的新技术，它在大型语言模型、多模态基础模型和人工智能系统中具有重要应用。该技术基于类型理论和范畴论，注重信息的结构和语法，提供了一种超越传统方法的框架。论文详细阐述了“元提示”的定义，并展示了它在不同人工智能应用中的优势。此外，论文还将“元提示”扩展到复杂推理领域，并将其推广到多模态基础模型设置中。该技术有望处理复杂多方面的数据。

元提示：用任务无关的支架增强语言模型

BriefGPT - AI 论文速递 ·

Vlogger是一个通用的人工智能系统，用于生成用户描述的分钟级视频博客。它通过智能地利用大型语言模型作为导演，将视频生成任务分解为四个关键阶段，并通过引入文本和视觉提示来提高片段的时空一致性。实验证明，Vlogger在零样本T2V生成和预测任务上达到了最先进的性能，并且能够从开放世界描述中生成超过5分钟的vlogs，保持视频的连贯性。

记录生活：实现你的 Vlog 梦想

BriefGPT - AI 论文速递 ·

最近的科技新闻包括：1、研究人员开发了一种能将脑电波翻译成文本的人工智能系统。2、微软推出了新的应用程序，允许用户随时访问免费的AI工具。3、三星即将推出的Galaxy S24手机将具备人工智能功能。4、Flowpilot允许使用智能手机设置汽车自动驾驶。5、研究发现，法学硕士在被提示为性别中立或男性时表现更好。6、OpenAI去年收入大幅增长。7、FDA批准了一种基于CRISPR的基因疗法，标志着治疗遗传疾病的新时代。

仅靠手机实现自动驾驶等最近几则科技新闻

极道 ·

加州大学伯克利分校的研究人员发现，人工智能系统缺乏创新能力。他们通过实验发现，儿童和成人能够以新方式看待工具并解决问题，而人工智能系统往往无法做到。研究人员建议从儿童的学习方法中汲取灵感，设计出更具创新能力的人工智能系统。

人工智能系统擅长模仿，但不擅长创新

程序师 ·