Data Science — одно из направлений информатики, которое особенно активно развивалось в последнее десятилетие и лежит в основе многих возможностей, которые сегодня предоставляет нам интернет. Оно тесно связано с такими популярными понятиями, как искусственный интеллект, машинное обучение, Big Data, прогнозирование, deep learning и многими другими. Именно в эту область крупные компании, такие как Google, Facebook, Amazon, Apple, IBM, Microsoft и другие, инвестируют огромные средства.
В этом модуле ученики попробуют себя в роли настоящих учёных-аналитиков, которым необходимо решить конкретную задачу. Под руководством преподавателя они пройдут все этапы работы Data Scientist — от получения данных и описания проблемы до поиска решения.
После завершения модуля ученики изучат:
— различные методы структурирования данных
— разные типы данных, их преимущества и недостатки
— как исследовать набор данных и какие критерии при этом учитывать
— простые алгоритмы прогнозирования (дерево решений, Random Forest, SVM, KNN)
— статистические понятия для интерпретации результатов
— простые алгоритмы кластеризации и группировки (K-Means, DBScan), их преимущества и недостатки
— способы представления результатов и простые типы диаграмм
— soft skills: работать с информацией, управлять вниманием и понимать свою задачу в командной работе