search icon search icon

Большие данные и машинное обучение

  • Сквозные технологии НТИ: Большие данные и искусственный интеллект
  • II уровень РСОШ
  • 100 баллов к ЕГЭ
  • Сквозные технологии НТИ: Большие данные и искусственный интеллект
  • II уровень РСОШ
  • 100 баллов к ЕГЭ
Математика Информатика
  • Этап 1
    27 сентября — 17 октября
    2021
  • Этап 2
    9 ноября — 10 января
    2022
  • Финал
    21 февраля — 30 апреля
    2022

Расписание

XXI век — это век информации, которую человечество научилось собирать, и теперь главный вопрос в том, что полезное из нее можно извлечь. Большие данные требуют большой проницательности, а машинное обучение позволяет обрабатывать ее алгоритмически.

В этом профиле участникам нужно будет решать задачи по анализу данных, предоставленными нашими партнерами — известными компаниями-разработчиками решений в области искусственного интеллекта.
Большие данные и машинное обучение1
Большие данные и машинное обучение2
Большие данные и машинное обучение3
Большие данные и машинное обучение4
Большие данные и машинное обучение5
Большие данные и машинное обучение6
Большие данные и машинное обучение7
01 7

Этапы соревнований

Этап 1

В рамках первого отборочного этапа участникам предстоит решить задачи по информатике и математике.

Этап 2

Во время отборочных этапов необходимо будет писать программы, разрабатывать алгоритмы по обработке данных, решать задачи с использованием современных технологий разработки программных средств.

В ходе второго отборочного этапа школьникам будут предложены онлайн-курсы, хакатоны (в них можно будет принять участие удалённо) и видеолекции ведущих российских специалистов в индустрии.

Финал

Финальная задача традиционно является классическим соревнованиям по построения прогнозных моделей. Участникам выдается размеченный набор данных, в котором дано множество объектов, описываемых признаками, и значение целевых переменных этих объектов. Участникам нужно будет разработать алгоритм предсказания меток для новых объектов, у которых известны значения указанных признаков. Участники не ограничены в применении алгоритмов и техник, однако их решение на языке Python должно запуститься в тестовой среде и выдать прогноз. Победителем считается команда, выдавшая наиболее точный прогноз.

В рамках заключительного этапа организаторами предоставляются вычислительные серверы, которые можно использовать для решения и можно будет оставлять обучаться модели на ночь, пока участники идут спать. Таким образом базовые знания работы в linux также не будут лишними.

Традиционно на решение задачи отводится несколько дней и все время участники могут видеть лидерборде, на котором выводится точность прогнозных моделей команд.

Требования к команде

Требования к команде

Знания

  • Данные нужно как-то хранить, поэтому нужны базовые знания о структурах данных;
  • Обработка данных алгоритмическая, поэтому нужны знания и понимания алгоритмов;
  • Для обработки используется машинное обучение, поэтому нужно как минимум понимание основных понятий (например, что такое переобучение) и основных алгоритмов и техник машинного обучения;
  • Базовая математическая подготовка позволит правильно ставить и декомпозировать задачи.

Hard skills

Программирование на Python, в том числе библиотеки работы с данными (numpy, pandas) и глубокого обучения (keras, PyTorch)

Численность команды и роли

Численность команды и роли

Формирование команд происходит после второго отборочного этапа, при этом максимальный размер команды — четыре человека, а минимальный — два. В команде точно должен быть человек, который имеет опыт в написании алгоритмов на Python.

Материалы подготовки

Разработчики

background image background image background image background image background image background image background image background image background image background image background image background image
background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image background image