Даты II этапа по некоторым профилям могут отличаться. С точными сроками проведения этапа можно ознакомиться в Личном кабинете участника на платформе «Талант».
Создайте систему рекомендаций и прогнозирования на основе анализа больших данных и машинного обучения.
Профиль посвящен работе с большими данными и машинным обучением. Большие данные дают ценную информацию о поведении клиентов, рынков и производственных процессов. Работа с большими данными помогает извлекать ценные инсайты и принимать обоснованные бизнес-решения. Машинное обучение позволяет автоматизировать процессы и улучшить эффективность работы в разных сферах: от финансов до медицины и производства.
Участники профиля анализируют массивы данных об активности пользователей социальных сетей, создают алгоритмы и разрабатывают рекомендательные системы, которые наиболее точно будут предлагать им подходящий контент.
«Наша команда не впервые участвует в НТО. Я прошел через несколько олимпиад, хакатонов и уже умел работать как с Docker, так и другими ПО и ML-моделями. Это значительно расширило наши возможности при работе с данными и позволило в итоге найти оптимальное решение задачи. Также у нас были классные вожатые! Они поддерживали, развлекали нас в свободное время и отвечали на любые вопросы — это очень помогло чувствовать себя комфортнее и сосредоточиться на выполнении олимпиадных заданий».
Вадим Ветров. 2025. Победитель.
Участникам предстоит решать задачи двух туров: инженерного и предметного.
Также участники освоят теорию машинного обучения через образовательный блок и повысят свои компетенции в анализе данных.
Для решения задач II этапа необходимо собрать команду: чем сплоченнее она будет, тем выше шансы на успех в финале. Участникам советуют развивать профессиональные и коммуникативные навыки: общаться, учиться распределять задачи, узнавать сильные стороны членов команды.
На этом этапе участники продолжат погружение в олимпиадное программирование и машинное обучение. Работа над задачами и изучение образовательных материалов профиля помогут участникам подготовиться к финалу и познакомят с платформой по проведению контеста. Дополнительно преподаватели ИТМО проведут вебинары, мастер-классы и хакатон.
В течение нескольких дней командам предстоит решать большую инженерную задачу. Участникам предстоит разработать точный алгоритм рекомендательной системы, который на основе данных о пользовательской активности в социальной сети (лайки, дизлайки, репосты) будет точно подбирать релевантный контент.
Для работы предоставляется набор данных с описанием и задание, включающее проверочные данные, критерии оценки и базовое решение. Задача участников — по заданному набору данных аппроксимировать скрытую зависимость в нём и построить предсказание целевой метки.
Начиная со II этапа участникам необходимо объединиться в команды. Тем, у кого команды нет, организаторы профиля помогут её найти (подробнее о командообразовании и том, как искать команду).
Чем больше компетенций в команде, тем выше её эффективность.
Участникам понадобятся следующие компетенции:
Программирование на Python.
Аналитика данных.
Основы программирования.
Переобучение.
Основы алгоритмов и техник машинного обучения, базовые знания о структурах данных.
Базовая математическая подготовка.
Для участия во II и заключительном этапах понадобится команда из 2–3 человек.
Теория вероятностей – наука о случайности
Программирование на Python
Материалы кружков (Deep Learning)
Онлайн-курс “Дискретные структуры”
Онлайн-курс “Основы статистики”
Сборник по итогам Олимпиады КД НТИ 2019/20. БДиМО
Курс Алгоритмы программирования и структуры данных
Сборник заданий 2024/25. Большие данные и машинное обучение
Сборник заданий 2023/24. Большие данные и машинное обучение