не только от качества, а в основном от динамики
насыщенные сцены, со множеством движущихся элементов - требуют либо тупо больший битрейт, либо более хитрую обработку
читай: более сильная нагрузка при декодировании (при большом битрейте), или более долгое время просчета при кодировании (при использовании сложных алгоритмов енкода)
идеал - найти баланс между первым и вторым
а если же видео в основном статика (фон статичный, например, и мало движущихся объектов) то тут можно и более простой пресет юзать