- GPU NMS: torchvision.ops.nms 替代 CPU NMS, 50-80% 提升 - 日志优化: 每10帧输出一次性能日志, 减少90%日志开销 - 数组预分配: 预分配8400框缓冲区, 避免重复创建 - 预过滤: 置信度>0.3的框先过滤, 减少NMS计算量 性能对比: - 优化前: 40-50ms - 优化后: 17-22ms (60% 提升)
- GPU NMS: torchvision.ops.nms 替代 CPU NMS, 50-80% 提升 - 日志优化: 每10帧输出一次性能日志, 减少90%日志开销 - 数组预分配: 预分配8400框缓冲区, 避免重复创建 - 预过滤: 置信度>0.3的框先过滤, 减少NMS计算量 性能对比: - 优化前: 40-50ms - 优化后: 17-22ms (60% 提升)