Анализ данных без контекста
Недавно коллега из роботов-доставщиков рассказал историю про раскапывание причины падения метрики.
Одна из ключевых метрик в логистике — скорость доставки. Наблюдают ее на дашборде, где выведена средняя по всему флоту. Как-то раз эта метрика упала. Смежники уверяют, что никаких радикальных изменений не делали, которые бы могли повлиять на скорость.
Снарядили отряд аналитиков для выявления причины. Первая гипотеза — проблема где-то в приборах измерения. Проверили всё: поставку данных, ETL, формулы, код, дашборды.
Нареканий нет, всё корректно.
Вторая гипотеза — видимо, что-то меняли, но что? Релизов софта не было в момент наблюдения спада метрики.
Перешли от аналитики средней скорости доставки флотом к просмотру перформанса индивидуально по роверу. Вывели среднюю скорость по дням для доставщика и увидели четкую ступеньку вниз. Причем для каждого ровера день ступеньки разный, но видно, что падения у всех доставщиков прошли в один временной период.
Оказалось, что в этот период была смена зимней резины на летнюю. Зимняя резина чуть больше в диаметре, и поэтому при одинаковой скорости вращения колес ровер проезжал больше и быстрее.
So What?
«Чистого» анализа данных без детального знания операционных процессов зачастую не хватает, чтобы быстро и правильно сделать вывод. Изучайте бизнес, в котором работайте.


