Как узнать сложность алгоритмов MapReduce в случае потоковой передачи Hadoop.?

Я сейчас использую Python для запуска своих программ, и я хочу оценить их точные временные сложности.

Но поскольку он использует потоки, то есть, поскольку он непосредственно читает ввод из файловой системы HDFS, я довольно запутан в отношении его сложности.

Например: одна из моих программ имеет сложность O (n2), если для хранения полного входного файла используется локальная память. Но после запуска через потоковое воспроизведение на самом деле занимает гораздо меньше времени, чем оригинальная сложность O (n2). Мне нужны его точные оценки. То есть сколько времени сокращается при чтении ввода непосредственно из файловой системы HDFS?

Пожалуйста помоги.

1