wide & shallow vs narrow & deep networkwide & shallow가 narrow & deep 보다 빠름!
narrow & deep 가 wide & shallow 보다 높음!$$ \text{Receptive field size}= L \times (k-1) + 1\newline (L\text{ : layer number, }k\text{ : kernel size)} $$
$L$ 증가
$k$ 증가
<aside> ❓ k vs L 논의해보면 좋을듯? 일반적으로 L 증가하는게 성능 증가하는데, k증가시킨다고 속도가 안느려지나? parameter 개수 늘어나도 parallel computation으로 속도저하 없나?
</aside>
Grouped Conv

Depth-Wise Conv

각 channel마다 group화!
NO FREE LUNCH
MobileNetV2에서 사용됨
