本文介绍了在DWS大集群中定位作业hang和残留问题的方法,通过查看通信系统视图、线程等待状态视图和活跃会话视图,可以观察作业的执行状态和线程的阻塞等待情况。通过分析堆栈和查询远端线程的状态,可以初步定位问题所在。其中,第一个问题是集群DN上存在未执行完的作业,第二个问题是集群CN上存在未执行完的作业但DN上的作业已经全部退出。需要进一步分析和联系责任田来解决问题。
完成下面两步后,将自动完成登录并继续当前操作。