Дата Кампус:
игры с большими данными

Может ли школьник освоить машинное обучение и анализ данных за 10 дней? Может, и это способно изменить то, как он воспринимает изучение географии, обществознания, экономики и управления. Научный руководитель «Дата Кампуса» Андрей Дерябин о том, как «взрослые» технологии анализа данных приспособить для решения образовательных задач старшеклассниками.
Андрей Дерябин
Эксперт Лаборатории компетентностных практик образования Института системных проектов Московского городского университета (МГПУ), научный сотрудник научно-исследовательского центра «Открытое образование» ФИРО РАНХиГС
От игр с музыкой к игре с данными
Эрик Циммерман, известный гейм-дизайнер и преподаватель дизайна игр в МТИ и Нью-Йоркском Университете, в 2013 году опубликовал Манифест Века игры (Manifesto For A Ludic Century), в котором заметил, что если XX в был веком технологий и веком изображений, требовавших от человека визуальной и технологической грамотности, то век XXI будет веком игр и близких к ним практик. Хоть и не в явной форме, Циммерман имел в виду не только видеоигры, но в широком смысле игровое использование медиа, искусства и информации, которое потребует от человека освоения компетенций в теории систем, социальных науках и дизайн-мышлении.
«Как цена на бензин в Калифорнии влияет на ближневосточную политику, и, в свою очередь, на экосистему Amazon? Подобные вопросы заставляют нас смотреть на то, как взаимосвязаны такие большие системы, видеть их комплексно, приводят к новым инсайтам. Они требуют игрового, инновационного, трансдисциплинарного мышления».
Недостаточно просто обладать аналитическими сведениями о таких системах, — продолжает Циммерман, — в XXI веке мы должны играть c самим созданием таких сведений. Другими словами, мы должны учиться быть дизайнерами и инженерами данных. С начала этого века мы играли (со все снижающимся возрастом игроков) с созданием и дистрибуцией цифровой музыки, затем видео, новостного контента, видеоигр и, наконец, чатботов с искусственным интеллектом. Сегодняшний старшеклассник пишет код на Python, легко создает чатбота и прикручивает его к облачному AI — настало время игр с данными.

Этот ход мысли привел педагогический коллектив Агентства гуманитарных технологий «Политика развития» к идее, что уже в старшей школе образовательная задача в таких областях как география, обществознание, экономика и управление может продуктивно решаться в ходе аналитического исследования средствами анализа данных и машинного обучения.
Ядро команды «Политики развития» с начала 2000-х занимается дизайном игровых образовательных программ, которые включают в себя элементы исследования и конструирования. Этот подход необходимо было дополнить программой обучения основами Data Science, и участие в проекте «Кампус молодежных инноваций» в рамках федерального проекта «Кадры для цифровой экономики» обеспечило эту возможность.
Образовательные вызовы
«Дата Кампус» — это 10-дневный интенсив, в котором приняло участие 300 старшеклассников Кемеровской области, ориентированных на изучение математики и программирования. Некоторые из них, но не все, были знакомы с языком Python, и никто раньше не имел дела с машинным обучением.
Важно подчеркнуть, что «Дата Кампус» — это не только про то «как строить нейросети». На кампусе совмещены учебные и образовательные задачи. С одной стороны, знание и навыки машинного обучения и анализа данных имеют самостоятельную ценность в качестве знакомства ребят с одной из «сквозных технологий» цифровой экономики. С другой стороны, они, в сущности, выполняют исследовательскую работу, включающую в себя отбор и подготовку данных, построение и проверку гипотезы, анализ и интерпретацию результатов. Для этого студентам приходится глубоко погружаться в исследуемую проблематику. Если в промышленной команде, выполняющей проект по Data Science, есть кодер, менеджер проекта, дата-инженер и эксперт, то на «Дата Кампусе» чуточку экспертами по теме проекта приходилось быть каждому, и в этом заключается важный образовательный результат. Они выбирают тему, ставят перед собой задачу, экспертируют свою проблему и предлагают варианты ее решения, вставая, таким образом, в управленческую позицию.

Такое совмещение образовательных и учебных задач дает важный для старшеклассника личностный результат: формирование представления о профессии и самоопределение по отношению к карьере в этой области.
Подкаст «Профессионалы образования» о детском образовательном отдыхе. Чем учебная задача отличается от образовательной? Как родителям оценить образовательную программу лагеря, чтобы сделать правильный выбор? Будущее: от предметных программ к метапредметным. Самоопределение старшеклассника.
Предсказуемый и непредсказуемый результат образовательного события
Если в учебной задаче, решаемой по образцу, решение наперед известно (например, предсказать на основе имеющихся данных какую-то величину, используя метод линейной регрессии), то в образовательной задаче ход решения и результат непредсказуемы. И в этом состояла главная интрига «Дата Кампуса».

Предметная часть обучения представляла собой лекционные и практические занятия по Python и алгоритмам машинного обучения, знакомство с программной средой, отработка материалов лекций на данных своего проекта, консультации экспертов. Результатом стали умения обрабатывать данные, решать стандартные задачи регрессии, кластеризации и классификации, применять к даным разные алгоритмы, настраивать модели машинного обучения.

Что касается образовательной задачи (та самая, с неизвестным заранее результатом) то она была поставлена так: «Каждая группа должна сформулировать обоснованную гипотезу с использованием данных, раскрывающую некоторый аспект социально-экономической реальности. Это может быть выявление связи, закономерности, тренда или иное. Вы можете использовать любые данные, включать в свой датасет любые признаки, находить любые зависимости, строить любые модели. Средствами анализа данных вы должны подтвердить или опровергнуть свою гипотезу, интерпретировать результат вашего исследования, предложить управленческое решение проблемы».
Таким образом свободная, творческая игра с данными студентов Кампуса не была никак ограничена, за исключеним того, что каждая команда, придумывая свою тему, должна была отнести ее к какому-либо из десяти предложенных нами направлений (или «систем», как их называет Циммерман в своем манифесте): экономика, транспорт, промышленность, социальная сфера и т. п.).

Результатом 10 дней стали 30 проектов, которые подтвердили наше предположение, что анализ данных и машинное обучение — чрезвычайно благодатная сфера для совмещения образовательных и учебных задач. Вот только несколько проектов (см. больше на инфографике):
  • Предиктивная аналитика: предсказание стоимости потребительской корзины в РФ в 2020 году (нейросеть, Multi Layer Perceptron Regressor);
  • Сортировка изображений на 6 классов для раздельного сбора мусора (нейросеть, Keras);
  • Сравнение пенсионного возраста в РФ с другими странами на основе анализа экономико-демографических признаков (линейная регрессия, DecisionTreeRegressor);
  • Определение факторов травмоопасности в горнодобывающей отрасли на основе статистики инцидентов (кластеризация, KMeans).
Очевидно, что для реализации этих проектов ребятам пришлось «прокачать» не только свой python, но метапредметные компетенции. Например, группе «Сортировка мусора» нужно было разобраться в экологической поблематике и соответствующей технологии, чтобы встроить в нее свой классификатор, а «Потребительской корзине» разобраться с экономическими понятиями инфляции, индекса потребительских цен, МРОТ, прожиточного минимума. Причем, оперировать им приходилось не мнениями и оценками, а количественными данными и публикациям посерьезнее, чем материал школьной программы.

Разумеется, такая интенсивная учеба требовала вечерней разгрузки, и для этого на кампусе работала сплоченная команда вожатых: были и интеллектуальные игры, и киноклуб, и дискотека, и многое другое. По результатам опроса, большинство участников «Дата Кампуса» хотели бы повторить этот уникальный опыт, а пока что его выпускники продолжают общение в чате «Кампуса» и в его группе «Вконтакте».
Слушайте тизер подкаста «Дата Кампус: может ли школьник освоить машинное обучение за 10 дней?»

Если статья была для вас полезной, расскажите о ней друзьям. Спасибо!

Читайте также:
Show more