745cadc8e7
feat: TensorRT 固定 batch=4 重构
...
- tensorrt_engine.py 工业级 Buffer Pool
- preprocessor.py 添加 pad_to_batch4()
- postprocessor.py 支持批量输出
- settings.py 固定 batch_size=4
2026-02-02 14:49:47 +08:00
956bcbbc3e
feat: TensorRT 工业级重构
...
- 添加 HostDeviceMem 类(Buffer Pool)
- _allocate_buffers() init 阶段一次性分配
- infer() 使用 async API + CUDA stream
- 回退机制:pagelocked 失败时用普通 numpy
2026-02-02 14:12:43 +08:00
0a1d61c1e2
fix: 修复 TensorRT bindings 问题
...
- tensorrt_engine.py 添加 pycuda 支持
- CUDA 上下文和流管理
- _is_in_working_hours 支持字符串格式
2026-02-02 14:00:21 +08:00
6dc3442cc2
fix: 添加资源释放幂等保护
...
- 添加 _released 标志防止重复释放
- release() 方法支持幂等调用
2026-01-30 10:48:28 +08:00
b67bda8042
fix: 修复 Python TensorRT 资源释放
...
- 移除不存在的 .destroy() 方法调用
- Python TensorRT 由 GC 管理,= None 即释放
2026-01-30 10:39:02 +08:00
a6130b5102
fix: 修复动态维度内存分配错误
...
- 处理 TensorRT 引擎的负维度 (-1)
- 将动态 Batch 维度替换为最小值 1
2026-01-30 09:20:05 +08:00
b0ddb6ee1a
feat(project): move edge_inference_service contents to root and update paths
...
- Moved all project files and directories (config, core, models, etc.) from
edge_inference_service/ to the repository root ai_edge/
- Updated model path in config/settings.py to reflect new structure
- Revised usage paths in __init__.py documentation
2026-01-29 18:43:19 +08:00