Fast-BEV代码复现实践,专业踩坑
最近在研究一些BEV视觉感知算法,这里记录一下Fast-BEV代码复现实践,专业踩坑^_^
理论这里就不详细介绍,详情见原作者论文Fast-BEV: A Fast and Strong Bird’s-Eye View Perception Baseline
其他csdn,知乎上理论讲解也比较详细。主要还是本人太菜,讲不了理论,这里只讲工程复现^_^
^_^
部署有问题的小伙伴欢迎留言和加Q
裙-472648720
BEVFusion代码复现实践
BEVFustion-TensorRT部署
BEV各算法环境部署实战汇总
1 运行环境搭建
ubuntu20.04,python-3.8, torch-1.10.0, cuda-11.3,cudnn-8.6
不要问其他版本能不能通,小白和不想折腾环境的童鞋直接抄作业 1.1 conda与cuda
cuda,conda,torch安装参考
采用conda管理python环境,毕竟方便,miniconda下载地址 安装步骤略显卡驱动cuda,cudnn安装网上帖子多,为了省略篇幅,默认安装好了 大家具体不知道各种库版本号对应关系,就直接跟着抄作业,cuda-11.3.0, cudnn-8.6.0,python-3.8, torch-1.10.0 , mmopenlab相关库版本也一样,直接抄作业conda和pip换国内源, 百度搜一下,防止国内安装失败 换源参考1.2 构建python虚拟环境
大家不知道某个库的具体版本,就直接抄作业,跟我一致就行,后面就不再强调 构建python环境python用3.8以上,3.7版本后续mmcv相关安装出了问题
conda create -n fastbev python=3.8
激活新环境 conda activate fastbev
torch安装 cuda与torch版本查询 我用的torch-1.10.0
pip install torch==1.10.0+cu113 torchvision==0.11.0+cu113 torchaudio==0.10.0 -f https://download.pytorch.org/whl/torch_stable.html
安装mmcv相关库 由于fastbev
出来很久了,而mmcv-full
已经更新到2.x.x
版本,改名为mvcc
, fastbev
还是用的 mmcv-full
# 安装mmcv-full安装时终端会卡住,不是卡住,是下载时间比较长,耐心等待pip install mmcv-full==1.4.0# 安装mmdetpip install mmdet==2.14.0# 安装mmdetpip install mmsegmentation==0.14.1
1.3 下载FASTBEV源码
可以直接拉取本人已经修改后的仓库代码gitee地址, 求个☆Star
,^_^
# 下载fastbev工程git clone https://github.com/Sense-GVT/Fast-BEV.git# 激活虚拟环境conda activate fastbev# 进入Fast-BEVcd Fast-BEV# 配置所需依赖包pip install -v -e . # or "python setup.py develop"
查看mmopenlab相关包版本号 python -c 'import mmcv;import mmdet;import mmdet3d;import mmseg;print(mmcv.__version__);print(mmdet.__version__);print(mmdet3d.__version__);print(mmseg.__version__)'
显示版本号如下:依次为mmcv,mmdet,mmdet3d,mmseg对应的版本号
其他依赖包:
pip install ipdb pip install timm
自此基本环境已经装好。
2 准备数据集
2.1 下载数据集
这里只介绍nuscenes数据集,nuscenes下载地址
由于nuscenes数据太大,这里只测试nuscense提供mini版本, 下载map跟mini,如下图点击红色框中US即可
下载点击US,Aias都行
下载后得到2个压缩的文件
解压到当前目录解压得到
nuScenes-map-expansion-v1.3与v1.0-mini
两个目录, 把nuScenes-map-expansion-v1.3
中的三个文件复制到v1.0-mini/map
目录下。最终得到新v1.0-mini
目录,就行训练所需的数据集。 2.2 数据集转换为FastBEV支持格式
进入Fast-BEV
工程目标, 创建data目录,然后将上面的v1.0-mini
文件夹复制到./Fast-BEV/data
下, 并将v1.0-mini
重命名为nuscenes
, 目录结构如下图所示:
因为使用的mini数据集, 转换时候加上参数--version
该数据未提供v1.0-test
文件
如果使用全部的nuscenes数据可以不跟--version
python tools/create_data.py nuscenes --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes --workers 10 --version v1.0-mini
执行后,产生下面红框中的文件
运行nuscenes_seq_converter.py由于使用的mini数据集无test文件,需要修改nuscenes_seq_converter.py文件,找到代码15行和20行,修改如下:
修改后,运行
python tools/data_converter/nuscenes_seq_converter.py
生成 nuscenes_infos_train_4d_interval3_max60.pkl
与 nuscenes_infos_val_4d_interval3_max60.pkl
两个文件,
这两个文件就是训练需要的数据集,如下图所示:
3 训练
3.1 训练配置
下载预训练模型pretrained_models下载地址 需要魔法上网
总体提供了r18,r34,r50
三种残差网络模型。这里下载cascade_mask_rcnn_r18_fpn_coco-mstrain_3x_20e_nuim_bbox_mAP_0.5110_segm_mAP_0.4070.pth
这个需要跟配置文件一致。配置文件也是 r18
, 下载后,新建一个pretrained_models
目录放入其中。如下图所示:
不修改配置文件可能出现3.2节的报错问题, 修改后,可直接跳过3.2小节
以 configs/fastbev/exp/paper/fastbev_m0_r18_s256x704_v200x200x4_c192_d2_f4.py
,文件为例:(当然其他几个配置文件也行)
将该配置文件中的将SyncBN改成BN,将AdamW2换成Adam;
该配置文件中146行代码去掉注释; 147-150代码加上注释, 如下所示
file_client_args = dict(backend='disk')# file_client_args = dict(# backend='petrel',# path_mapping=dict({# data_root: 'public-1424:s3://openmmlab/datasets/detection3d/nuscenes/'}))
安装setuptools-58.0.4版本 conda install setuptools==58.0.4
配置文件中预训练模型地址修改, 代码331行,load_from
参数指向第1步下载的预训练模型地址,如果不知道相对路径,可以直接给绝对路径,我这里是相对路径 load_from = 'pretrained_models/cascade_mask_rcnn_r18_fpn_coco-mstrain_3x_20e_nuim_bbox_mAP_0.5110_segm_mAP_0.4070.pth'
训练 python tools/train.py configs/fastbev/exp/paper/fastbev_m0_r18_s256x704_v200x200x4_c192_d2_f4.py --work-dir work_dir --gpu-ids 0
参数说明
--gpu-ids 0代表gpu使用第1块。本机只有一块gpu--work-dir 输出文件目录,包含日志等文件其他参数详情建train.py中parse_args()函数
终端出现以下图中红色框中内容,代表训练已经成功运行, 具体训练周期epoch,batch_size等参数可以在fastbev_m0_r18_s256x704_v200x200x4_c192_d2_f4.py
配置文件中修改
3.2 训练时报错
错误1方案1: 点击红框上面一行,跳转到报错的文件中,注释掉使用distutils的代码
方案2:AttributeError: module 'distutils' has no attribute 'version'
conda install setuptools==58.0.4
错误2146行去掉注释,147-150加上注释
错误3将SyncBN改成BN
错误4将AdamW2换成Adam
4 测试
4.1 测试推理
由于自己的显卡显存受限,训练的模型,测试结果不太理想,直接采用原作者提供的训练好的模型进行测试,下载地址
本人采用的fastbev_m0_r18_s256x704_v200x200x4_c192_d2_f4中epoch_20.pth
, 下载地址
python tools/test.py configs/fastbev/exp/paper/fastbev_m0_r18_s256x704_v200x200x4_c192_d2_f4.py pretrained_models/epoch_20.pth --out output/result.pkl
out 必须跟.pkl后缀。用来保存检测结果 --out 必须跟.pkl后缀。用来保存检测结果--show 不要加,加上会报错,可能原作者未优化好
4.2 可视化
由于测试运行代码时,加入–show会报错,可以tools/misc/visualize_results.py
把上一步的result.pkl生成视频流展示。
python tools/misc/visualize_results.py configs/fastbev/exp/paper/fastbev_m0_r18_s256x704_v200x200x4_c192_d2_f4.py --result output/result.pkl --show-dir show_dir
报错1: assert len(_list) == len(sort)
解决办法:Fast -BEV/mmdet3d/datasets/nuscenes monocular_dataset.py
, 找到192行修改成193行样子:
解决方法,安装这2个包:
pip install imageio[ffmpeg] imageio[pyav]
最后运行visualize_results.py ,生成video_pred.mp4与video_gt.mp4
两个视频:
其中某一帧可视化:
发现m5-r18
模型效果不是很好,很多只检测了个寂寞,大家可以尝试用m5-r50的epoch_20pth
, 下载地址
参考文章
感谢各位大佬的辛勤付出, 瑞思拜^-^
!!!
作者源码github地址
参考文章一
参考文章二
小伙伴们部署时遇到问题,欢迎各位小伙伴留言,欢迎进入bev交流釦裙472648720,大家一起学bev!
如果觉得文章可以,一键三连支持一波,瑞思拜^-^