- _parse_yolo_output: 只检测人(class_id=0),移除类别循环 - NMSProcessor: 纯 NumPy 向量化 NMS,移除 Python 循环 - 延迟从 40-50ms 17-20ms (60% 提升)