极佳视界的GigaWorld-1模型在WorldArena评测中获得全球第一,超越谷歌和英伟达,展现出在物理遵循、3D准确度和视觉质量方面的领先技术,推动具身智能生态的发展。
AI产品面临认知偏差、落地断层和体验割裂三大痛点。百度的王颖提出通过GenFlow构建超级个人智能体,以提升用户的个性化、自由化和通用化能力,帮助用户成为超级个体。
UC伯克利等团队研发的LeVERB框架首次实现人形机器人视觉感知与运动控制的结合,机器人能够根据语言指令自动完成复杂动作。在Unitree G1机器人上测试,零样本成功率达到80%,整体任务成功率为58.5%,显著优于传统方法。
洛斯阿拉莫斯国家实验室的研究团队利用Meta的Wav2Vec-2.0语音识别AI分析2018年夏威夷基拉韦厄火山的地震信号。研究发现,断层移动时会产生独特信号,AI能够实时追踪这些模式。尽管AI尚无法预测地震,但为理解断层行为提供了重要进展。
本研究解决了CT图像重建中缺乏大规模开放数据集的问题。通过2DeteCT数据集评估多种机器学习算法,提出了提升算法可比性和可靠性的流程,以促进未来的比较研究。
本研究针对在光声计算断层成像(PACT)中使用半球测量 aperture 进行数据采集的问题,提出了一种基于学习的半扫描滤波反投影重建方法。通过对3D乳腺影像的虚拟成像研究和实际数据的应用,结果表明该方法可准确重建半扫描数据的3D图像,并在数据差异较大的情况下保持重建的准确性。
本研究探讨了基于生成对抗网络(GAN)的低剂量CT去噪技术,旨在解决辐射暴露与图像质量之间的矛盾,展示了GAN在精准医学中的潜力及其临床应用的关键发现。
去噪扩散概率模型(DDPMs)通过逐步将数据扩散为高斯噪声并去噪,在图像生成中表现优异。本文介绍了部分扩散模型(PartDiff),通过将图像扩散到中间潜在状态来生成新数据,减少了去噪步骤。实验显示,PartDiff在不降低质量的情况下显著提高了效率。
本研究提出了NF-APACT框架,解决了光声计算机断层成像中的波前失真问题,提高了图像重建的速度和精度。实验结果表明该方法表现出色。
本研究提出了一种新的细粒度分类方法,通过光学相干断层成像和光学相干断层血管成像将葡萄酒色斑分为五种类型,发现不同类型在血管形态和深度信息上有显著差异,为葡萄酒色斑的亚型识别和治疗提供了准确指导。
本研究使用多目标学习的卷积神经网络来搜索和表征夸克星光谱中的强氢Lyman-Alpha吸收,并进行分类和定量测量。该算法能够准确预测HI吸收的存在性,并估计相应的redshift zabs和HI柱密度NHI。通过自定义训练集进行模型训练,并在SDSS-DR7和BOSS数据集中验证了深度学习在天文光谱测量方面的有效性。
研究发现,在锥束 CT 上的刚性运动补偿算法中,选择合适的基于样条的运动模型对恢复频率至关重要。优化的算法能够准确拟合样条节点,对于慢运动模式,增加节点数不会损害重建性能,反而可以扩大可恢复的高频范围。最佳的运动模型应根据图像解剖、临床用途和扫描协议进行精心调整,以确保准确的运动补偿。
计算机断层扫描(CT)通过投影图像计算物体内部结构的图像。近年来,深度学习在CT造影图像去伪影方面表现出良好结果。提出了一种多阶段深度学习伪影去除方法,实验证明该方法有效且优于基于深度学习的后处理方法。
本研究提出了一种名为ARTran的模型,用于高度近视的OCT数据的筛查。该模型通过引入可调整的类别嵌入和移动子空间转换矩阵,能够适应不同条件下的筛查,并提供不确定性评估的证据。实验证明了该方法的有效性和可靠性。
本文研究了一种通过非线性正演模型直接从原始测量数据中重建信号的技术,能减少金属伪影。
本文介绍了一种名为HiFormer的新方法,使用Swin Transformer模块和基于CNN的编码器设计了两种多尺度特征表示,以有效进行医学图像分割。通过Double-Level Fusion(DLF)模块在编码器解码器结构的跳跃连接中实现全局和局部特征的细粒度融合。实验结果表明,HiFormer在计算复杂度、定量和定性结果方面优于其他基于CNN、Transformer和混合方法。
完成下面两步后,将自动完成登录并继续当前操作。