Tidy data БЛОГ

Анализ данных в спорте

Берем 250 велосипедистов и начинаем измерять их
Анализ данных применяется во всех областях жизни и спорт не исключение. В этой статье показываю, что я обнаружил, изучив 250 увлеченных спортсменов-любителей.

Но есть одно НО. Если спрашивать гонщиков о результатах, то показатели будут мягко говоря завышенными. Поэтому исследование состояло из двух частей: опрос и веб-скрапинг сервиса Strava.
    Strava – это популярная социальная сеть для бегунов и велосипедистов. Её особенность - это возможность записывать показатели тренировок при помощи GPS-устройств.

    Веб-скрапинг – технология получения данных напрямую с веб-сервера интересующего сайта

    Измерять, а не спрашивать

    Итак, еще раз.
    1. Задаем вопросы.
    2. Просим оставить ссылку на свой аккаунт в Strava.
    3. Обеспечиваем анонимность и использование ответов только после статистической обработки.
    4. Profit!
      Сразу отмечу, что выборка не отвечает главному критерию репрезентативности - случайному отбору.

      Опрос проводился в интернете на просторах нескольких велоклубов. И у многих велосипедистов просто не было возможности принять участие в исследовании. Например, потому что они много тренируются и у них нет времени сидеть в интернете.
      Анализ данных в спорте
      Именно поэтому результаты анализа относятся только к опрошенным респондентам и их нельзя обобщать на всех абсолютно всех велосипедистов.
      Случайный отбор – это главный критерий репрезентативных выборок. Только обеспечив его можно обобщать выводы, полученные по части совокупности на всё множество объектов.
      Одномерные графики отражают предпочтения опрошенных.

      Половина респондентов в качестве основного велосипеда используют стальной. Shimano – лидер не только на рынке рыболовного снаряжения, но и самый популярный производитель навесного оборудования для гоночных велосипедов. Самый популярный тип педалей - "Контактные - МТБ"

        Лучше сразу использовать шлем

        Каждый третий опрошенный ездит на велосипеде без шлема (график слева). Это грустная статистика. «Разрежем» эти данные опытом отцов (график справа). В таком представлении видно, что доля людей, которые не используют шлем по мере приобретения опыта постоянно сокращается. Существует и стабильная группа "самосознательных": 43% используют шлем всегда, начиная с первых поездок.
          Если вы только начинаете ездить на велосипеде - купите шлем сразу.
          Не ждите пока в необходимости этой покупки убедит опыт.

          Вечный спор – какой материал лучше

          Велосипедисты обожают спорить о том, какие велосипеды лучше. И самые горячие споры касаются материала из которого должна быть изготовлена рама. В двух словах: углеволокно (карбон) – это легкий, но дорогой и менее прочный материал. Сталь отлично гасит вибрации и надежна. Алюминий сильнее вибрирует, зато за счет формовки позволяет достичь высокой прочности рамы при низком весе.

          Итак. Мы знаем, что сталь предпочитают 49% опрошенных. Теперь взглянем на двухмерный график. «Режем» распределение материалов опытом гонщиков. А с опытом все меньше любителей отдают предпочтение стальным велосипедам. Доля алюминиевых и карбоновых байков, наоборот растет. Заставляет задуматься автора, как владельца стального коня.
              Материал рамы велосипеда
              В конечном счете, если нас интересуют спортивные результаты, то давайте сравним «скорость рам».

              Самые быстрые - карбоновые. Их средняя скорость - 23.8 км/ч. Это на 1.8 км/ч выше средней скорости алюминиевых и на 3.4 км/ч выше скорости стальных. Если изучить другие характеристики, то становится очевидным, что карбон выбирают серьезные спортсмены. Это те, кто тренируются больше и интенсивней, поэтому их результаты выше.

              Возможно такое, что различия в средней скорости получены просто из-за того, что в исследовании не участвовали особо юркие владельцы стальных и алюминиевых велосипедов. Существует критерий, который позволяет рассчитать вероятность получить такие данные случайно. И эта вероятность равна всего 3%. Автору снова пора задуматься над покупкой карбонового велосипеда. И над более интенсивными тренировками тоже.

                  Как ехать быстрее

                  Материал рамы – это лишь характеристика спортивного снаряда. Посмотрим, как еще можно объяснить различия в результатах.

                  Для начинающих велосипедистов справедлива формула прогресса, согласно которой каждые 1900 пройденных километров добавляют +1 км/ч к их средней скорости. Но объем тренировок объясняет различия в скорости спортсменов только на 8%. И это логично, ведь важно не то сколько вы проехали, а насколько эффективно тренировались.

                  Мощность педалирования и сердечный пульс - это главные метрики интенсивности тренировок. Они позволяют понять: велосипедист неспешно прогуливается или работает на максимуме своих возможностей. К сожалению, я не располагаю этими данными, хотя их тоже можно выгрузить из Strava. Спортсменов, обладающих дорогостоящими пульсометрами и ваттметрами в нашей выборке только трое.

                    Так, и как же ехать быстрее?

                    Посмотрим, чем еще быстрые велосипедисты отличаются от медленных коллег. Следующие графики рассказывают целую историю.

                    По оси Y - средняя скорость тренировки.
                    По оси X - средняя дистанция.
                    Серые линии посередине отражают средние арифметические значения этих переменных и разделяют карту на 4 сегмента. Верхний правый сегмент – это "элита". Люди, чьи результаты выше среднего по обоим показателям.

                    Размер и цвет точек передают информацию о других признаках. На каждом из графиков эти признаки отличаются: тип велосипеда, годовой накат, материал рамы, вес велосипеда и т.д.
                      Анализ Strava, скорость и дистанция
                      Следующая диаграмма возвращает нас к спору о материалах рам. Из 13 самых сильных спортсменов семь на алюминиевых велосипедах, пять на карбоновых и только один на стальном.

                      Любопытно, что низкий вес, за который порой приходится доплачивать буквально тысячи долларов не является решающим фактором (цена на байк весом ниже 7 кг. может составлять 5 000$ - 10 000$). Самые быстрые велосипедисты ездят не на самых легких велосипедах. Средний вес велосипедов в верхнем правом сегменте – 8.7 кг. Средний вес по выборке – 9.4 кг.
                        Анализ Strava, материал рамы и вес велосипеда
                        Заключительный график этой серии проливает свет на то, без чего вы точно не сможете приблизиться к лучшим. И это SPD-SL педали!

                        Как видно, нарушить эту эвристику удалось только одному сумасшедшему выбросу, который на обычных педалях (!) продемонстрировал лучшую скорость - 30.4 км/ч при средней длительности тренировки - 45.6 км и среднем наборе высоты - 316 м.
                          Анализ Strava, тип педалей и набор высоты
                          Поэтому покупайте SPD-SL педали...
                          И хороших тренировок!
                          Понравилась статья?