16337 956bcbbc3e feat: TensorRT 工业级重构
- 添加 HostDeviceMem 类(Buffer Pool)
- _allocate_buffers() init 阶段一次性分配
- infer() 使用 async API + CUDA stream
- 回退机制:pagelocked 失败时用普通 numpy
2026-02-02 14:12:43 +08:00
2026-02-02 14:12:43 +08:00
2026-02-02 14:05:37 +08:00
2026-02-02 14:00:21 +08:00
2026-01-30 11:34:51 +08:00
2026-02-02 14:05:37 +08:00
Description
边缘推理层
37 MiB
Languages
Python 100%