香港大学数据智能实验室开源了轻量级个人AI助手nanobot,代码量不足4000行,功能强大且易于开发。nanobot支持多种模型接口和工具调用,具备多会话和跨会话记忆能力,已在GitHub获得41.1k stars,降低了开发门槛,提供详细教程,适合开发者快速上手。
蚂蚁与港大联合推出PromptCoT 2.0框架,专注于任务合成与强化学习。实验表明,该框架在数学代码推理任务上达成新SOTA,显著提升模型性能。PromptCoT 2.0通过期望最大化优化生成更具挑战性的问题,并开源4.77M合成数据,推动大模型推理能力的提升。未来将探索环境合成与多模态任务。
机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。
机器之心数据服务已上线,提供高效稳定的数据获取,简化数据爬取流程。
香港大学、字节跳动Seed和复旦大学联合推出的Polaris方法,通过700步强化学习训练,使4B模型在数学推理能力上超越多款商业大模型,特别是在长文本生成方面表现突出。该方法强调动态调整训练数据和超参数,提升了模型的多样性和准确性。
UC伯克利等机构提出了All-Angles Bench基准,用于评估多模态大语言模型的多视图理解能力。研究显示,现有模型如GPT-4o在多视图推理方面与人类水平存在显著差距,尤其在遮挡和相机位姿估计任务中表现不佳。该基准涵盖90个真实场景,包含2100组问答对,旨在推动多视图理解研究的进展。
香港大学与英伟达等团队提出的Centaur方法,通过动态调整模型权重和使用Cluster Entropy评估不确定性,显著提升了自动驾驶汽车在不确定场景中的适应性与安全性。在navtest测试中,Centaur的表现接近人类驾驶水平,安全性能显著提高。
VideoRAG是香港大学黄超教授实验室的最新研究,旨在高效理解超长视频。该框架通过多模态知识索引和检索,整合视频中的视觉、音频和文本信息,支持跨视频推理。在LongerVideos基准数据集上,VideoRAG表现优异,显著提升了视频理解能力,为未来研究提供了新思路。
港大与字节合作推出新的视频生成模型Goku,基于校正流Transformer,支持文本生成视频和图像生成视频。该模型生成效果真实,成本低,受到网友称赞,认为其将颠覆市场。模型训练使用了大规模数据集,但尚未公开使用。
港大黄超教授团队提出的GraphAgent框架,通过多智能体协作,融合图数据与文本信息,显著提升预测与生成任务的性能。在8B参数下,该框架优于70B大模型,尤其在论文评审中有效预测录取可能性,展现出良好的零样本学习和跨域泛化能力。
AIxiv专栏促进了学术交流,报道了2000多篇深度伪造研究。近期综述分析了深度伪造检测模型的可靠性,提出迁移性、可解释性和鲁棒性三大挑战,强调模型在实际应用中的重要性。研究者需提升模型综合性能,以保护个人隐私。
GraphAgent是港大黄超团队开发的多智能体系统,旨在高效融合图数据与文本数据。通过图生成、任务规划和任务执行三个核心智能体,该系统支持知识图谱构建和文本生成等多样化任务,并在多个基准数据集上表现出显著的性能提升,具有广泛的应用潜力。
我和奶奶带着两个宝宝参加了香港大学的“幸福家庭博览会”。活动通过游戏和互动提升了对家庭福祉的认识,宝宝们在气球和摊位活动中玩得很开心,并获得了礼品。这次活动让我意识到家庭幸福与社会发展和环境变化密切相关,希望未来能创造更多美好回忆。
周日,宝妈在实验室工作,爷爷奶奶陪伴宝宝完成寒假作业。午餐后,全家参观香港大学,感受历史氛围。下午在尖沙咀逛街,享受购物与美景,最后带着美好回忆回家,记录亲子时光。
香港大学的CUBE框架实现了基于事件相机的可控视频生成,无需训练,提升了视频的创意和质量。CUBE通过提取动态边缘信息并结合文字描述生成视频,表现优于传统方法,适用于多种领域,未来将探索更多应用。
香港大学联合华南理工大学和百度推出了长时间城市交通预测模型OpenCity,结合了Transformer架构和图神经网络,具有卓越的零样本预测能力和快速的情境适应能力。该模型解决了交通预测模型的空间泛化、时间泛化、长期预测和时空异质性挑战,展示了优异的性能和广泛的适用性。
复旦大学、香港大学和中国科学院的研究团队提出了一种基于语义记忆的动态神经网络设计方案,使用忆阻器实现。该设计在ResNet和PointNet++上验证,准确度与软件相当,计算预算和能耗分别减少了48.1%和15.9%。这种设计受到大脑的启发,能够将输入与过去的经验联系起来,并实现低能耗高效运算。研究为未来模拟大脑和计算资源的自适应分配提供了启示。
字节跳动豆包大模型团队与香港大学合作开发了名为ByteCheckpoint的大模型Checkpointing系统,支持多个训练框架,提升性能和易用性,实验结果表明存储和读取性能显著提升。团队计划扩展系统功能,支持更大规模的GPU集群训练任务和全生命周期的Checkpoint管理。
完成下面两步后,将自动完成登录并继续当前操作。