小红花·文摘

本研究解决了自动化外科阶段识别（SPR）在非线性手术过程中面临的挑战，特别是机器人辅助部分肾切除手术（RAPN）。研究表明，视频片段及特定视觉标记的应用可提高分阶段分类的准确性，外科医生在识别中表现优于初学者，且当引入时间上下文时，人工智能的表现也显著提升。

外科医生与计算机视觉：外科阶段识别能力的比较分析

BriefGPT - AI 论文速递 ·

本研究解决了在长时间行星际任务中，由于人员配置和通信延迟限制，传统外科手术方法的有效性不足的问题。提出了一种针对半自主外科机器人手臂的新颖模糊快速随机树算法改编方案，显著提升了路径搜索时间743%和路径成本43%，为未来太空手术的实施提供了高效的解决方案。

模糊快速随机树算法在2自由度半自主外科机器人手臂中的避障应用

BriefGPT - AI 论文速递 ·

本研究探讨了大型视觉-语言模型在外科图像理解中的应用，发现其在泛化能力和上下文学习方面表现优异，但在空间和时间推理任务上仍显不足，为未来的应用提供了重要见解。

外科学人工智能中大型视觉-语言模型的系统评估

BriefGPT - AI 论文速递 ·

本研究解决了机器人学习领域中数据稀缺的问题，特别是在安全关键的外科应用中获取高质量数据的挑战。提出的dARt Vinci系统通过增强现实手部追踪和高保真物理引擎捕获微小操作，使得数据收集更加灵活和高效，最终实验结果显示数据吞吐量平均提高41%，总实验时间减少10%。

dARt Vinci：用于外科机器人学习的自我中心数据收集

BriefGPT - AI 论文速递 ·

本研究解决了实时外科视频分割中帧率对分割性能的影响问题。通过对不同帧采样率下的SAM2模型进行评估，我们发现，虽然在常规评估设定下，低帧率在平滑分割不一致性方面表现优于高帧率，但在实时流媒体场景中，高帧率仍能提供更好的时间一致性和稳定性，且外科专业人士普遍偏好高帧率分割结果。这些发现强调了在AI辅助外科手术中实时评估的重要性。

少即是多？重新审视实时零-shot外科视频分割中的帧率重要性

BriefGPT - AI 论文速递 ·

Paramus Park口腔外科网站的制作：规划、设计与开发之旅

DEV Community ·

本研究针对外科手术视频中解剖结构的语义分割和物体检测的深度学习模型进行了评估，填补了当前外科应用中计算机视觉技术落后的空白。通过对2014至2024年之间的58项相关研究进行范围审查，发现大型器官的分割精度较高，但小结构的分割依然面临挑战。研究结果突出显示了深度学习在外科视频实时应用中的重要进展，尤其是在较大器官的处理上。

深度学习在外科视频分割和物体检测中的方法：一项范围审查

BriefGPT - AI 论文速递 ·

创建Paramus Park口腔外科网站：规划、设计与开发的综合指南

DEV Community ·

该研究探讨了深度学习在机器人手术中器械分割的应用，提出了多种新方法以提高分割精度和效率。研究表明，现代深度学习技术在器械分割任务中表现优异，结合不同方法可显著提升准确性。此外，研究提出的无监督分割方法减少了对人工标注的依赖，展现了在临床应用中的潜力。未来应关注自动化处理和技术扩展。

AMNCutter：亲和力注意力引导的多视图归一化切割器用于无监督外科器械分割

BriefGPT - AI 论文速递 ·

CASTformer是一种新型对抗变压器，专用于二维医学图像分割，具有更高的精度和性能。研究还提出了SurgicaL-CD方法，通过一致性蒸馏扩散技术在无配对数据下生成高质量手术图像，解决了标注数据稀缺问题，推动了计算机辅助外科系统的发展。

基于类别感知语义扩散模型的外科场景分割图像合成

BriefGPT - AI 论文速递 ·

本文提出了一种名为SurgicaL-CD的新方法，通过一致性蒸馏扩散技术在无配对数据的情况下生成高质量的手术图像，解决了外科领域标注数据稀缺的问题。研究表明，该方法在图像质量和训练数据集的效用上优于现有的生成对抗网络和扩散模型，为计算机辅助外科系统的发展提供了新思路。

利用解剖知识扩散模型合成多类外科数据集

BriefGPT - AI 论文速递 ·

本研究针对外科视频语言预训练中因知识领域差异和多模态数据稀缺所带来的挑战，提出了一种层次知识增强的方法及程序编码外科知识增强的视频语言预训练框架（PeskaVLP）。研究发现该方法能显著提高零-shot迁移性能，为进一步的外科场景理解研究提供通用的视觉表征。

基于程序意识的外科视频语言预训练与层次知识增强

BriefGPT - AI 论文速递 ·

该研究利用卷积神经网络分析手术视频，自动评估外科医生的技能，包括工具使用模式和运动经济性。通过深度学习方法，提出了多路径框架和时空神经网络，显著提高了手术技能评估和步骤识别的准确性，推动了微创手术的发展。

内镜垂体手术中的自动化外科技巧评估：基于高保真台架模型的实时器械追踪

BriefGPT - AI 论文速递 ·

该研究利用卷积神经网络分析手术视频中的工具移动，自动评估外科医生的技能。文章探讨了基于视觉的手术工具分割和跟踪方法，强调深度学习在手术效率和数据科学中的应用潜力。通过无监督和自监督模型，显著降低了对人工标注的依赖，推动了手术图像分析的进展。

SURGIVID：高效注释的外科视频物体发现

BriefGPT - AI 论文速递 ·

本研究提出了一种无监督的视频帧分割方法，通过自监督预训练模型和拉普拉斯矩阵实现。该方法在多个数据集上表现优异，对临床应用有潜在影响。

无人工干预的外科仪器分割重访：图划分视角

BriefGPT - AI 论文速递 ·

本研究通过构建新数据集Surg-QA，包含102,000个外科视频-指令对，并采用两阶段问答生成管道，提高了外科视频的多模态对话能力。研究结果显示，LLaVA-Surg在开放式外科视频问答任务中性能明显超越之前的模型，展现出卓越的多模态对话能力。

LLaVA-Surg：通过结构化外科视频学习迈向多模态外科助手

BriefGPT - AI 论文速递 ·

本研究提出了多种改进的医学图像分割模型，如AdaptiveSAM和SAMSNeRF，旨在解决手术场景中的数据稀缺问题。通过结合Segment Anything Model（SAM）和Neural Radiance Field（NeRF），实现了高保真度的动态手术场景重建。SAM 2在不同手术视频中的零样本分割表现出色，显示了其在医学图像处理中的广泛适用性和快速适应能力。

外科SAM 2：通过高效帧剪枝实时段任何外科视频

BriefGPT - AI 论文速递 ·

本研究探讨了Segment Anything Model（SAM）在机器人手术中的鲁棒性和零样本泛化能力。结果表明，SAM在复杂手术场景中的仪器分割效果不佳且缺乏鲁棒性。提出的SurgicalSAM方法结合LoRA调整，改善了分割性能。适当的提示（如边界框）能显著提升模型表现，但在攻击情况下鲁棒性下降。总体而言，SAM在医学图像分割中仍需进一步优化。

机器人手术中的SAM 2：外科视频分割的鲁棒性和泛化的实证评估

BriefGPT - AI 论文速递 ·

EndoGSLAM是一种高效的内窥镜手术SLAM方法，结合高速渲染和组织重建，实现了100帧/秒的在线相机跟踪。该系统在内窥镜图像重建中表现出色，提升了手术过程中的可用性和重建质量，并提出了多种深度估计和动态重建方法，显著改善了微创手术的效果和精度。

BodySLAM: 一个广义的单目视觉 SLAM 框架，用于外科应用

BriefGPT - AI 论文速递 ·

本文探讨了自我监督学习（SSL）在医学图像分析中的应用，强调预训练数据集的多样性对下游任务性能的重要性。研究表明，适当的预训练策略能显著提高诊断准确性，尤其在有限标注数据情况下，SSL技术能有效减少对注释数据的需求，推动医学图像人工智能的发展。

探索自我监督学习中数据集多样性对于外科计算机视觉的影响

BriefGPT - AI 论文速递 ·