Microsoft Agent Framework(MAF)1.0.0-rc2 发布,新增对 Agent Skills 和脚本执行的支持。通过 Shell 工具,Agent 可执行技能中的脚本,实现知识驱动的行为。课程内容包括工具与技能的区别、脚本执行指引及安全设计,旨在构建具备领域知识和执行能力的智能体。
单位举办了《人工智能的发展、现状与未来》培训,张钹教授主讲,内容包括AI定义、发展阶段及核心流派,探讨行为主义与内在主义的差异,以及知识驱动与数据驱动AI的特点与局限。大语言模型如ChatGPT展现技术高度,但存在幻觉与不可解释性问题。AI在医疗、网络安全等领域应用初步,但鲁棒性不足,未来需在类脑计算等方面持续探索。
本研究探讨了知识驱动的序列分类,特别是在知识随时间变化的情况下。提出了一种新的神经符号框架,并与传统神经网络架构进行了比较,揭示了该领域的挑战及神经符号方法的不足,为未来研究提供了参考。
本文探讨了如何通过有效的提示技术提升开发者与AI工具的协作效率,分享了项目背景、约束定义、逐步迭代和错误解决等提示策略,以提高代码质量。强调了“知识驱动的编码”方法,确保开发者在利用AI速度的同时,理解架构和安全性。未来,开发者需掌握系统设计、与AI沟通及协调复杂系统的能力。
本研究提出了一种创新的知识驱动型入侵检测框架OmniSec,利用大语言模型(LLMs)解决现有入侵检测系统在实际部署中需大量人工干预的问题。该系统在公共基准数据集上的表现优于现有方法,展现出显著的自动化潜力。
本研究提出了一种新的知识驱动贝叶斯赌博策略(KABB)框架,旨在解决多智能体系统中的静态知识假设和协调效率低下的问题。该框架通过三维知识距离模型和知识感知的汤普森采样策略,增强了智能体的协调能力,实现高性能与低计算需求的最佳成本性能平衡。
2012年,谢伟迪从通信领域转向计算机视觉,专注于医疗人工智能。他认为通用医疗AI系统能够整合多模态数据,促进疾病诊断。团队利用网络爬虫收集医学数据,构建多模态模型,强调知识驱动的重要性,未来将关注临床需求和基因组学研究。
本文研究了链式思维(CoT)对大型语言模型(LLMs)多步推理能力的影响,发现即使包含无效推理步骤,模型仍能保持80-90%的性能。提出了知识驱动的思路连贯框架(KD-CoT),旨在改善推理过程并减轻错误传播。此外,文章还探讨了战略推理的现状与未来方向,强调跨学科方法对决策性能的提升。
本文探讨了大型语言模型(LLMs)在因果推理中的应用,提出结合知识与数据驱动的方法构建因果结构。研究表明,LLMs能有效提升因果分析的准确性和效率,尤其在医学研究中。通过设计提示和评估标准,LLMs被视为提供先验知识的有力工具,推动因果研究的发展。
本文提出了一种改进的视觉问答(VQA)评估指标,以更好地与人类判断相关联。研究通过多模态数据训练VQA系统,达到了超越人类专家的准确性。同时,探讨了大型语言模型在视觉问答中的应用,并提出了新的知识驱动评估方法,以解决物体虚构和事实准确性问题。研究强调了创建未来偏移数据集的重要性,以增强VQA模型的稳健性。
本文提出了多种推理框架,如Faithful CoT和LogiCoT,以提升大型语言模型的推理能力。研究表明,Chain-of-Thought提示显著改善模型在复杂任务中的表现,尤其在数学和推理方面。此外,结合视觉信息的多模态-CoT框架在ScienceQA基准测试中超越了人类表现。研究还探讨了知识驱动的方法,以验证和修正模型推理过程,减少错误。
该文章介绍了一种基于对话上下文和外部知识的知识驱动对话系统,通过引入主题转换框架来提供充足的主题发展知识。实验结果显示,该系统在知识选择方面具有更好的优势和泛化能力。
M2KR是一个用于知识驱动的视觉问答的框架,通过开发PreFLMR模型在各种任务中取得了最先进的结果。同时,还研究了PreFLMR的可扩展性行为,为未来多模型检索系统的发展提供了有用的参考。
本文探讨了知识驱动的自动驾驶技术,强调了数据偏差敏感性、处理长尾场景的困难和缺乏可解释性等限制。知识驱动方法被视为克服这些挑战的有希望途径。通过利用大型语言模型、世界模型、神经渲染和其他人工智能技术,梳理了该领域的先前研究工作,并为未来自动驾驶的研究和实际应用提供了洞见和指导。
本论文研究了使用深度神经网络解决多元时间序列插补问题。通过添加知识驱动的增强,包括投影时间注意力、全局自适应图卷积和Fourier插补损失,使得模型适用于多种插补问题。案例研究证明了该模型的可解释性和实证结果的有效性。
该论文介绍了一种名为KnowExpert的框架,将轻量级适配器注入预训练的语言模型中,实现知识驱动的对话任务。实验结果表明,该方法在开放领域闲聊场景中表现良好,推理效率高。
完成下面两步后,将自动完成登录并继续当前操作。