GPUの各コアの実行で分岐が起きたときには、分岐したときの命令と分岐しないときの命令は各スレッドで並列実行されない。分岐したときの命令と分岐しないときの命令の両サイクル分が全スレッドに掛かってしまう。これがGPUにおいて分岐が遅くなる理由