关于 Batch Normalization(多选),以下说法正确的是:
小 batch 时效果变差
与 Dropout 同时开可能导致方差不匹配
推理时使用滑动平均的均值与方差
训练时用当前 batch 统计均值与方差