Shortcuts

可视化

数据流水线可视化

python tools/visualizations/vis_pipeline.py \
    ${CONFIG_FILE} \
    --output-dir ${OUTPUT_DIR} \
    --phase ${DATASET_PHASE} \
    --number ${BUNBER_IMAGES_DISPLAY} \
    --skip-type ${SKIP_TRANSFORM_TYPE} \
    --mode ${DISPLAY_MODE} \
    --show \
    --adaptive \
    --min-edge-length ${MIN_EDGE_LENGTH} \
    --max-edge-length ${MAX_EDGE_LENGTH} \
    --bgr2rgb \
    --window-size ${WINDOW_SIZE}

所有参数的说明

  • config : 模型配置文件的路径。

  • --output-dir: 保存图片文件夹,如果没有指定,默认为 '',表示不保存。

  • --phase: 可视化数据集的阶段,只能为 [train, val, test] 之一,默认为 train

  • --number: 可视化样本数量。如果没有指定,默认展示数据集的所有图片。

  • --skip-type: 预设跳过的数据流水线过程。如果没有指定,默认为 ['ToTensor', 'Normalize', 'ImageToTensor', 'Collect']

  • --mode: 可视化的模式,只能为 [original, pipeline, concat] 之一,如果没有指定,默认为 concat

  • --show: 将可视化图片以弹窗形式展示。

  • --adaptive: 自动调节可视化图片的大小。

  • --min-edge-length: 最短边长度,当使用了 --adaptive 时有效。 当图片任意边小于 ${MIN_EDGE_LENGTH} 时,会保持长宽比不变放大图片,短边对齐至 ${MIN_EDGE_LENGTH},默认为200。

  • --max-edge-length: 最长边长度,当使用了 --adaptive 时有效。 当图片任意边大于 ${MAX_EDGE_LENGTH} 时,会保持长宽比不变缩小图片,短边对齐至 ${MAX_EDGE_LENGTH},默认为1000。

  • --bgr2rgb: 将图片的颜色通道翻转。

  • --window-size: 可视化窗口大小,如果没有指定,默认为 12*7。如果需要指定,按照格式 'W*H'

注解

  1. 如果不指定 --mode,默认设置为 concat,获取原始图片和预处理后图片拼接的图片;如果 --mode 设置为 original,则获取原始图片; 如果 --mode 设置为 pipeline,则获取预处理后的图片。

  2. 当指定了 --adaptive 选项时,会自动的调整尺寸过大和过小的图片,你可以通过设定 --min-edge-length--max-edge-length 来指定自动调整的图片尺寸。

示例

  1. 可视化 ImageNet 训练集的所有经过预处理的图片,并以弹窗形式显示:

python ./tools/visualizations/vis_pipeline.py ./configs/resnet/resnet50_8xb32_in1k.py --show --mode pipeline
  1. 可视化 ImageNet 训练集的10张原始图片与预处理后图片对比图,保存在 ./tmp 文件夹下:

python ./tools/visualizations/vis_pipeline.py configs/swin_transformer/swin_base_224_b16x64_300e_imagenet.py --phase train --output-dir tmp --number 10 --adaptive
  1. 可视化 CIFAR100 验证集中的100张原始图片,显示并保存在 ./tmp 文件夹下:

python ./tools/visualizations/vis_pipeline.py configs/resnet/resnet50_8xb16_cifar100.py --phase val --output-dir tmp --mode original --number 100 --show --adaptive --bgr2rgb

学习率策略可视化

python tools/visualizations/vis_lr.py \
    ${CONFIG_FILE} \
    --dataset-size ${Dataset_Size} \
    --ngpus ${NUM_GPUs}
    --save-path ${SAVE_PATH} \
    --title ${TITLE} \
    --style ${STYLE} \
    --window-size ${WINDOW_SIZE}
    --cfg-options

所有参数的说明

  • config : 模型配置文件的路径。

  • dataset-size : 数据集的大小。如果指定,build_dataset 将被跳过并使用这个大小作为数据集大小,默认使用 build_dataset 所得数据集的大小。

  • ngpus : 使用 GPU 的数量。

  • save-path : 保存的可视化图片的路径,默认不保存。

  • title : 可视化图片的标题,默认为配置文件名。

  • style : 可视化图片的风格,默认为 whitegrid

  • window-size: 可视化窗口大小,如果没有指定,默认为 12*7。如果需要指定,按照格式 'W*H'

  • cfg-options : 对配置文件的修改,参考教程 1:如何编写配置文件

注解

部分数据集在解析标注阶段比较耗时,可直接将 dataset-size 指定数据集的大小,以节约时间。

示例

python tools/visualizations/vis_lr.py configs/resnet/resnet50_b16x8_cifar100.py

当数据集为 ImageNet 时,通过直接指定数据集大小来节约时间,并保存图片:

python tools/visualizations/vis_lr.py configs/repvgg/repvgg-B3g4_4xb64-autoaug-lbs-mixup-coslr-200e_in1k.py --dataset-size 1281167 --ngpus 4 --save-path ./repvgg-B3g4_4xb64-lr.jpg

常见问题