UC伯克利CS188讲座笔记介绍了启发式搜索方法。启发式用于估计到达目标的距离,贪婪搜索选择启发式值最低的节点,但不保证最优解。A*搜索结合总成本估计,若启发式可接受,则保证完整性和最优性。启发式的支配性和一致性是优化搜索的关键条件。
最近我学习了用户体验(UX),认为开发者应关注用户体验而非仅执行设计。Nielsen的可用性原则可以提升软件开发中的用户体验,包括提供即时反馈、使用现实术语、确保用户控制、保持一致性、预防错误、简化记忆负担、提供灵活性、设计美观、帮助用户解决错误及提供有效文档,从而创建更直观、专业的产品,提升用户满意度。
本研究探讨了接送问题,提出了一种新颖的逻辑基础分解方法(LBBD),有效解决了车辆间中途装载交换和严格时间窗口的问题。结合改进的大邻域搜索(LNS)算法,LBBD显著提高了最优性差距,LNS则提供了接近最优解,具有重要应用潜力。
本研究提出了一种基于强化学习的新方法,解决了领域无关动态规划中的搜索不足问题。实验结果显示,该方法在多个基准领域上显著优于传统的DIDP和贪婪启发式方法。
Cloudflare的应用安全团队通过将启发式规则迁移至新规则引擎,提升了机器学习模型的准确性,支持更复杂的规则,增强了客户对机器人流量的可见性和控制,减少了误报率,改善了检测效果。
本研究针对当前自动化调查生成中,LLM生成的调查与人类撰写的调查在大纲质量和引用准确性上的显著差距提出了解决方案。引入SurveyForge,该系统通过分析人类编写的大纲逻辑结构来生成大纲,并利用高质量的论文进行内容生成和优化。同时,通过构建SurveyBench,对AI生成调查在参考文献、大纲和内容质量三个维度进行全面评估,实验结果显示SurveyForge在性能上优于之前的研究。
本研究解决了大型语言模型(LLM)在复杂规划任务中的不可靠性问题。我们提出了一种自动启发式发现(AutoHD)的新方法,使得LLM能够明确生成启发式函数,从而指导推理过程中的搜索并准确评估中间状态,不需要额外的模型训练或微调,显著提高了规划的准确性和可解释性。大规模实验表明,该方法在多个基准测试中显著优于其他方法,特别是在某些数据集上准确率几乎提高了一倍。
本研究解决了现有规划任务系统忽视任务描述中丰富语义信息的问题,提出了一种新颖的规划方法,利用大型语言模型(LLMs)的参数化知识作为爬山搜索的启发式指导。研究发现,该方法在家庭环境中的任务成功率比类似系统提高了22个百分点,并生成始终可执行的计划,展示了省略中间语言翻译步骤的潜力。
本研究解决了将战略框架与决策启发式整合的不足,通过语义分析提出了新方法。论文的创新在于利用先进的自然语言处理技术,成功将6C模型与三十六计整合,提供了一种通用的方法论,从而实现框架与启发式的有效结合,为企业战略提供可操作的指导。
本研究针对大型语言模型(LLMs)在政治问题上的人类意图与价值对齐的难题进行探讨,填补了LLMs偏离经验立场的原因及条件研究的空白。采用认知科学中的代表性启发式理论,实验结果表明,LLMs在模仿特定政党的立场时,常常比人类受访者更夸大这些立场,揭示了LLMs对政治刻板印象的脆弱性,并提出了有效的基于提示的干预策略,以减少代表性对LLMs响应的影响。
启发式评估是识别数字产品可用性差距的有效方法。Nielsen的10条可用性原则,如系统状态可见性、与现实世界的匹配等,为用户界面设计提供了基础,帮助设计师提升用户体验,使产品更直观友好。
启发式评估(HE)是一种通过专家分析界面来识别可用性问题的方法,基于既定原则(如Nielsen的十条可用性原则)。HE可在设计早期、产品发布前及迭代改进中进行,能节省时间和成本,但可能受评估者偏见影响。有效的HE需明确目标、选择合适原则并独立评估,最后整理优先解决的问题。
本研究提出了一种新颖的三角自适应低秩适应框架(TriAdaptLoRA),旨在优化大语言模型微调中的参数分配,提高资源效率,超越现有方法。
本研究解决了深度神经网络在对抗攻击下鲁棒性不足的问题。提出了一种基于标准差的正则化方法,旨在通过最大化模型输出概率的修改标准差来增强对抗训练的效果。实验结果表明,该方法能显著提升神经网络对更强攻击(如CW和Auto-attack)的鲁棒性,且改善了模型的泛化能力。
本研究提出NDR-QL方法,以解决Q学习收敛速度慢的问题。NDR模型的预测准确率提高了5%,收敛速度比基线快90%。
本文研究了人工智能与软件工程的融合,提出了一种迭代的方法论,证明了人工智能可以全面替代人类程序员进行代码创建和优化。该方法结合了大型语言模型与形式验证、测试驱动开发和渐进式架构指导,在SWE-bench基准上取得了38.6%的改进,挑战了对人类创造力的传统认知,展示了在实际工程中的AI优势。
本研究探讨大型语言模型在算术推理中的机制,发现其正确答案依赖于实现简单启发式的神经元,这些启发式组合是模型算术准确性的关键。
本文介绍了多目标奖励函数的神经网络架构搜索框架MONAS,旨在优化神经网络的预测准确率和功耗。实验结果表明,MONAS在计算机视觉应用中能够实现更高的分类准确性。此外,研究探讨了多种搜索算法和框架的创新,提升了神经组合优化的效率,展示了其在实际应用中的潜力。
本文探讨了语言模型在处理事实信息时的不同反应,解决了以往解释缺乏重要区分的问题。我们提出了一种名为PrISM的模型特定方法,以构建不同预测场景的数据集,并应用因果追踪技术分析这些场景的表现,发现聚合混合示例的结果可能仅代表信号最强的场景。这项研究为语言模型的事实补全提供了更细致的分析工具和理解途径。
本文介绍了可解释责任共享(IRS)方法,用于解决家庭机器人任务与运动规划中的效率问题。该方法通过分解复杂任务为易管理的子任务,并与人类使用模式相符合,提升机器人的决策与执行效果。该方法适应性强,可在多样家庭环境中扩展使用。
完成下面两步后,将自动完成登录并继续当前操作。