Данный документ представляет собой пошаговую инструкцию по работе со статистическими данными футбольных команд трех возрастных категорий (16, 17, 18 лет). В руководстве описаны этапы подготовки базы данных, включая очистку и дополнение показателей, методы проведения статистического анализа (расчет характеристик, поиск выбросов) и разведочного анализа (группировка по амплуа, стилю игры и результативности).
Введение
Данная работа посвящена анализу статистики футбольных команд региона трех возрастных категорий (16, 17, 18 лет). Статистика является сводной за весь соревновательный сезон. По каждой команде предоставлено два типа файлов: статистика игроков и статистика матчей с соперниками.
Подготовка базы данных
Согласно своему варианту необходимо скопировать данные команд в единую базу данных. При выполнении работы следует соблюдать следующие требования:
- Не допускается наличие пустых строк и объединенных ячеек.
- Необходимо проверить соответствие наименований столбцов.
- Необходимо проверить корректность копирования данных (учитывая риск автоматического перевода чисел в формат даты в Excel).
- Для каждой таблицы необходимо определить тип шкалы представленных показателей. В отчете требуется указать типы шкал и количество показателей, относящихся к каждой из них.
Обработка данных: Статистика игроков
При подготовке базы данных по игрокам необходимо выполнить следующие действия:
- Заменить все прочерки на 0.
- Добавить столбец «Амплуа» (нападающий, защитник, полузащитник, вратарь).
- Добавить столбец «Положение на поле» (центральный, крайний).
- Добавить столбец «Стиль амплуа» (атакующий, опорный).
- Для всех показателей, представленных только в относительных значениях (%), добавить столбцы с абсолютными значениями.
Обработка данных: Статистика матчей
При подготовке базы данных по матчам необходимо выполнить следующие действия:
- Заменить все прочерки на 0.
- Для всех показателей, представленных только в относительных значениях (%), добавить столбцы с абсолютными значениями.
- Добавить столбец «Разница мячей». При расчете: если играли «дома», из левой цифры вычитается правая; если «в гостях», из правой вычитается левая. При проигрыше значение должно быть отрицательным.
Статистический анализ
Статистический анализ проводится отдельно для статистики игроков и статистики матчей.
Статистика игроков: Анализ характеристик
Для каждой команды необходимо выполнить следующие расчеты:
- Найти статистические характеристики: min, max, размах, среднее, мода, медиана.
- Описать наличие или отсутствие выбросов данных.
- Описать соответствие моды, медианы и среднего (только при наличии значимых отклонений).
- Сравнить статистические характеристики между командами своего региона и описать значимые отклонения.
- Посчитать суммы показателей для каждой команды. По каждому показателю определить лучшую и худшую команду (значение показателя указывать в скобках).
Статистика матчей: Анализ характеристик
Для каждой команды необходимо выполнить следующие расчеты:
- Найти статистические характеристики: min, max, размах, среднее, мода, медиана.
- Описать наличие или отсутствие выбросов данных.
- Описать соответствие моды, медианы и среднего (только при наличии значимых отклонений).
- Сравнить статистические характеристики между командами своего региона и описать значимые отклонения.
- Посчитать суммы показателей для каждой команды. По каждому показателю определить лучшую и худшую команду (значение показателя указывать в скобках).
Разведочный анализ
Разведочный анализ направлен на выявление закономерностей в разрезе различных параметров.
Разведочный анализ: Статистика игроков
Необходимо провести группировку данных по следующим критериям:
- В разрезе команды и амплуа: найти средние и суммы по всем показателям (для относительных — только среднее). Выделить минимумы и максимумы. Сделать выводы.
- В разрезе команды и положения на поле: найти средние и суммы по всем показателям (для относительных — только среднее). Выделить минимумы и максимумы. Сделать выводы.
- В разрезе команды и стиля амплуа: найти средние и суммы по всем показателям (для относительных — только среднее). Выделить минимумы и максимумы. Сделать выводы.
Разведочный анализ: Статистика матчей
Необходимо провести группировку данных по следующим критериям:
- В разрезе команды: найти средние и суммы по всем показателям (для относительных — только среднее). Выделить минимумы и максимумы. Сделать выводы о стиле игры команды (например: мало ударов, много передач, много единоборств и т.д.).
- Классификация команд: на основе суммы столбца «Разница мячей» разделить все команды региона на 3 группы (мало, средне, много).
- Анализ групп: для каждой группы по всем показателям найти средние и суммы (для относительных — только среднее). Выделить минимумы и максимумы. Сделать выводы о преимущественном стиле игры каждой группы.
