В ЦИФРЕ. МЕТОД

Измерить счастье

300 участников собрались в Югре, чтобы изучить методики анализа данных на «Кампусе молодежных инноваций» в рамках федерального проекта «Кадры для цифровой экономики». Мероприятие прошло при поддержке Департамента образования и молодежной политики Ханты-Мансийского автономного округа — Югры и губернатора Ханты-Мансийского автономного округа — Югры Натальи Комаровой. О том, как проходило обучение, EdExpert рассказал Александр Попов, директор АНО ДПО «Открытое образование».
  • Александр Попов
    директор АНО ДПО «Открытое образование»
На «Кампусе» сложилось 39 команд, каждая из которых работала над своим проектом. Инженерные темы выбрали 36% участников, гуманитарные — 64%, но из десяти лучших по качеству реализации проектов оказалось всего два аналитических и целых восемь технических (в основном связанных с обработкой изображений).
Tоп-10 проектов
Классификация интерьеров квартир по фото
Прогноз популярности музыкального трека
Классификатор музыкальных композиций по эмоциональному состоянию слушателя
Определение наличия повреждений на автомобиле по фотографии
Автоматизация сортировки продуктов при помощи компьютерного зрения
Скрининг на пневмонию по рентгеновским снимкам
Анализ лесовосстановления в субъектах РФ с учетом вырубки и лесных пожаров
Скрининг на рак кожи по фотографиям
Выявление лесных пожаров по аэрофотосъемке, пожароопасных регионов и анализ причин пожароопасности
Выявление лесных пожаров по аэрофотосъемке, пожароопасных регионов и анализ причин пожароопасности
Мы видим, что технические темы проектов у школьников «идут» легче. Они, возможно, сложнее гуманитарных в плане обработки данных и создания моделей, но концептуально проще. Условно говоря, «есть пять тысяч фотографий фруктов, пять тысяч фото овощей, и мы научим нейросеть отличать одно от другого». Сюда относятся задачи, связанные с техникой и инженерией, например с компьютерным зрением, или с областями, в которых студенты имеют хотя бы потребительский опыт. Например, они чувствуют себя экспертами в сфере мобильных приложений, музыки, соцсетей.
В отношении социально-экономических тем дела обстоят сложнее. Студенты не очень сильны в этих областях. Они проходили что-то в школе по экономике и обществознанию, но не в состоянии актуализировать эти знания под задачу — придумать исследовательский проект, где объектом или предметом является социокультурный или политико-экономический конструкт, например «бедность», «регион» или «счастье». Уже на этапе формулировки гипотез учащиеся сталкиваются с тем, что для такого объекта трудно сформулировать определение, выделить существенные признаки и их корреляты из разных дисциплинарных областей и подобрать соответствующие данные.
Организатор «Кампуса» — АНО ДПО «Открытое образование»
Как измеряется «счастье» или «регион»? Каковы его количественные признаки? Сколько нужно переменных, чтобы адекватно представить эти объекты? Какие переменные при этом важнее других? Сложно. Видно, что у студентов просто нет опыта работы с такими объектами. Больше половины участников берутся за них, но выдают очень слабый результат с точки зрения стандартов гуманитарного знания. А «инженеры», которые работают с концептуально гораздо более простыми задачами, быстрее приходят к результату. И мы показываем, как можно работать с многомерными социально-экономическими объектами, анализировать значимость признаков, конструировать их, строить предсказания.
Релевантность интересам
Когда речь заходит о преподавании школьникам искусственного интеллекта, машинного обучения, наук о данных, можно услышать: «Да это так сложно! Они не знают математику. Как без матстатистики этим можно заниматься?!» Можно — на определенном уровне. Дело в том, что мы за общую дата-грамотность, а не за то, чтобы из всех делать профессиональных дата-аналитиков. Дело вообще не в математике и точно не в программировании. Там программирования не очень много, и код можно написать по образцу. Можно создать и настроить модель машинного обучения, имея самое поверхностное представление о математических основаниях алгоритма, стоящего за нею. Это, конечно, будет, так сказать, репродуктивный навык: я подсмотрел и воспроизвел, далее перебором установлю такие параметры модели, чтобы она выдавала приемлемое качество. Или даже почитаю что-то об этом в интернете и применю лайфхак. Я даже могу перебрать несколько моделей с разными алгоритмами и взять в качестве решения ту, которая дает наилучший результат. Но в данном случае мы, скорее, имеем дело с хорошими репродуктивными навыками, а не с продуктивной деятельностью.
Мы за общую дата-грамотность, а не за то, чтобы из всех делать профессиональных дата-аналитиков
Продуктивная деятельность проявляет себя именно на начальном этапе разработки проекта, включающего в себя «понимание» задачи или ее постановку, «начальное изучение данных», их поиск и «подготовку» под задачу. Это как раз способность рассмотреть сложный объект и увидеть, в каких измерениях он существует: в общественном, экономическом, культурном, физическом, политическом, финансовом. Наш опыт показывает, что именно здесь старшеклассники испытывают наибольшие сложности. И здесь очень важно, что с ребятами у нас работают профессионалы из индустрии. Они являются ролевыми моделями, которые демонстрируют определенную культуру мышления. А инструментальные навыки подтянутся.
Для эффективного обучения данные и результаты работы с ними должны быть релевантными интересам студентов. Когда учащиеся не представляют, как данные, с которыми им предложили работать, связаны с реальной жизнью, учебные задачи и действия могут представляться им затруднительными или бессмысленными. Поэтому темы проектов у нас всегда идут от студентов, от команд. Сначала многие проектные идеи выглядят завиральными, и с ними приходится много работать наставникам, но в итоге этот подход оправдывает себя. Образовательная программа должна предусматривать решение таких образовательных задач, которые имеют статус «настоящих» для всех ее участников.
«Часть участников „Кампуса“ выбрала проекты по социально-экономическим темам. Ключевая идея таких проектов — поиск инсайтов и содержательных выводов на основе данных. Другая часть участников сконцентрировалась на реализации прикладных алгоритмов, например в области компьютерного зрения. Мне как преподавателю было очень приятно видеть вовлеченность ребят, их интерес к лекциям и мастер-классам, умение работать в команде и презентовать проекты. Навыки, полученные на „Кампусе“, обязательно пригодятся ребятам в будущем».
— Илья Бойцов
преподаватель «Кампус-Югра», руководитель команды машинного обучения в Rambler & Co, аспирант НИУ ВШЭ
Подробнее о «Дата-Кампусе»
Если статья была для вас полезной, расскажите о ней друзьям. Спасибо!

Читайте также: