深層学習の層数について

深層学習や転移学習では層を深くすればするほど原理的には予測精度は高くなるのでしょうか？
現在kerasのvgg16を用いてファインチューニングを行なっていますが全結合層を三層ほどにして学習した時より一層だけで学習した時の方が精度が高くなっています。深層学習や転移学習の強みは層を深くして複雑な問題に適応できるようになる事だと思うのですが、層が浅い方が精度が高くなるのは何故なんでしょう？