Обучение

Консультация
Консультируем с 9:00 до 18:30Выходной: суббота и воскресенье


Сообщение об ошибке

Обучение

Сообщение об ошибке

Основы Data Science

Профессиональный курс

Курс по Data Science направлен на приобретение знаний, навыков и умений по извлечению, структурированию и использованию полезной информации из неструктурированных, а также разрозненных источников. Он охватывает основные современные средства Data Mining, Machine Learning и Big Data. Использование указанных технологий даёт неоспоримое преимущество не только организациям на рынке товаров и услуг, но и людям на рынке труда.

Описание курса

Формы обучения

Вечерняя / Дистанционная, Минск

По мере набора группы
Офлайн или онлайн занятия по расписанию:
понедельник и среда с 18.50 до 21.40
Подходящий формат Вы выбираете сами!
Тренер: Сидоренко Роман Data Sciencist – GFAIVE - full-stack data engineering and AI consulting firm, Минск
2499 BYN
216 уч.ч (шесть месяцев)
Рассрочка шесть выплат 459 BYN/ месяц

При подаче заявки укажите, хотите ли Вы
посещать занятия в аудитории
или подключаться дистанционно
В группе конкурс.
Условия по телефону +375 (29) 683-22-24
№ группы: Mk-DS1-05-20

Условия отбора

Зачисление на курс производится на конкурсной основе по результатам:

  • теста по английскому языку;

  • решения задач на языке программирования Python;

  • устного собеседования с преподавателем на знание основ математики.

Для кого этот курс

  • для разработчиков, желающих расширить свои компетенции;

  • для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;

  • для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;

  • для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.

Необходимая подготовка

Для чего этот курс

Курс предназначен для: 

  • приобретения знаний в областях Data Mining, Big Data и Data Science;

  • формирования устойчивых навыков и умений по постановке и решению аналитических и исследовательских задач с использованием математической статистики и современных информационных технологий, а также разработки информационных рекомендательных систем.

Вы будете уметь

  • осуществлять сбор, обобщение и очистку исходных информационных данных;

  • находить аналитические зависимости в структурированных и неструктурированных данных;

  • осуществлять постановку и решение задач математического программирования и исследования операций;

  • знать и уметь применять основные алгоритмы машинного обучения и математического программирования;

  • знать, как работает Machine Learning;

  • уметь пользоваться основными инструментами Data Mining, Big Data и Data Science;

  • знать основные типы и архитектуру нейронных сетей;

  • реализовывать, внедрять и обучать Machine Learning модели;

  • решать задачи Computer Vision, Natural Language Toolkit, а также прогнозирования временных рядов;

  • знать концепции Map Reduce и CUDA;

  • знать принципы функционирования высоконагруженных систем;

  • разрабатывать рекомендательные системы.

Программа курса

  1. Введение в Data Science
    Объект Data Science.
    Взаимосвязь Data Mining, Big Data и Data Science.
    Инструментарий Data Science.
    Основные способы получения данных.
    Базовый эксплоративный анализ и визуализация данных.
  2. Математические основы Data Science
    Основы матричного исчисления.
    Реализация матричных операций в Python.
    Основы теории вероятности и математической статистики.
    Проверка статистических гипотез в Python.
    Основы математического программирования и исследования операций.
    Классификация алгоритмов математического программирования.
    Визуализация данных в Python.
  3. Основы Data Science и Machine Learning
    Принципы построения моделей в Data Science.
    Метрики качества моделей. Проверка качества модели.
    Введение в Deep Learning и Machine learning.
    Объект Deep Learnig и Machine Learning. Классы решаемых задач.
    Большие данные и параллельные вычисления.
    Подходы к построению высоконагруженных систем.
    Обобщение и сбор данных для обучения их очистка и нормализация.
    Обзор и классификация алгоритмов ML.
  4. Основные алгоритмы Machine Learning
    Алгоритмы «Дерево решений», «Случайный лес», «K-ближайших соседей», «Градиентный бустинг».
    Кластеризация и поиск ассоциаций.
    Линейная и логистическая регрессия. Ограничения, преимущества и недостатки.
    Обучение с учителем.
    Обучение классификатора на размеченных данных.
    Проверка качества модели: переобучение, регуляризация, обучающая и тестовая выборки.
    Борьба с переобучением: ансамблирование. Обзор методов ансамблирования.
    Реализация алгоритмов в Python.
  5. Методы предобработки данных
    Снижение размерности, разреженные данные, многомерные пространства.
    Коррелирующие параметры.
    Нерациональное использование памяти, сложность моделей.
    Статистический анализ данных, выбор параметров на основе корреляции.
    Снижение размерности данных: поиск подмножеств, регуляризация, уменьшение пространства.
    Векторное разложение.
    Методы декомпозиции.
    Спрямляющие пространства.
  6. Рекомендательные системы
    Введение в рекомендательные системы.
    Различие между предсказаниями и рекомендациями.
    Типы рекомендательных систем.
    Постановка целей.
    Неперсонализированные рекомендации.
    Способы построения рекомендательных систем.
    Цепи Маркова.
    Групповые рекомендации.
  7. Распознавание изображений, машинное зрение
    Теоретические основы обработки изображений.
    Форматы данных (RGB, CMYK, B&W), принципы и алгоритмы сжатия изображений, примеры чтения и конвертации изображений.
    Выделение признаков изображений.
    Задача поиска изображения по шаблону, представление свойств изображения с помощью гистограмм.
    Поиск похожих картинок по контенту.
    Сегментация изображений, детекция объектов.
    Детектор лиц на изображении.
  8. Введение в нейронные сети
    Основные элементы нейронных сетей.
    Классификация архитектур нейронных сетей.
    Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
    Регуляризация.
    Инициализация весов.
    Сверточные нейронные сети.
    Практическое применение сверточных рекурентных и генеративно-конкурирующих сетей в задачах Computer Vision.
  9. Распознавание естественного языка
    Введение в обработку текста.
    Частотный анализ.
    Законы Ципфа и Хипса.
    Морфологический и синтаксический анализ.
    Векторная модель и методы снижения размерности в ней.
    Классификация текстов.
    Извлечение именованных сущностей.
    Языковые модели.
    Извлечение информации.
    Генерация текстов.
  10. Временные ряды
    Временные ряды.
    Модели построения прогнозов.
    Разложение временного ряда на компоненты.
    Автокорреляция и корелограммы.
    Стационарность ряда.
    Сложные модели прогнозирования.
    Прогнозирование временных рядов на цепях Маркова.
  11. Общение с заказчиком. Требования к Data Science проектам
    Cпособы выяснения требований, проверка их выполнимости.
    Формализация и утверждение требований с заказчиком.
    Общий порядок составления отчетов.
    Цели, явные и неявные ожидания заказчиков проекта.
    Описание зависимостей и способов воздействия на важные для заказчика факторы.
    Практический опыт создания хайлоад моделей.
    Выбор алгоритмов, библиотек, тонкой настройки моделей.
  12. Подведение итогов
    Защита дипломных проектов.

Трудоустройство выпускников

IT-Academy не только обучает, но и помогает слушателям, нацеленным на результат, найти работу. Выпускники курса «Основы Data Science» участвуют в «Программе трудоустройства», с помощью которой можно получить заветную должность практически в любой IT-компании!

Роман Сидоренко

Специальность:Data Science
Опыт работы:8 лет

Сфера интересов: С++, Python, MathCard, Mathlab, Wolfram, LPsolve, Statistica, SPSS,  R,  Computer vision,  OpenCv, Apache, Hadoop,  Django, Keras, PyAlgoTrade, Machine Learning,  Deep Learning, Nltk, NLP, Fasttext, CUDA, Map Reduce ,Cafee, Pytorch, SciPy, NumPy, SkyKit, Theano, Xgboost, libffm.

Профессиональный путь: В 2005 закончил году Военную Академию Республики Беларусь по специальности «инженер по радио и спутниковым телекоммуникациям». В 2010 году закончил магистратуру этой же академии с присвоением степени магистра технических наук.

С 2011 года занимаюсь научной и исследовательской работой в Научно-исследовательском институте Вооруженных Сил Республики Беларусь. Профессиональная область: разработка и сопровождение, создания и модернизации технических и организационно-технических систем различного назначения.

В 2016 году назначен начальником научно-исследовательского отдела обеспечения геопространственной информацией государственного учреждения «Научно-исследовательский институт Вооруженных Сил Республики Беларусь». 

В 2017 году защитил диссертацию в государственном учреждении «Научно-исследовательский институт Вооруженных Сил Республики Беларусь» с присвоением ученой степени кандидат военных наук.

Мною опубликовано более 20 научных работ, получено 2 патента. В настоящее время присвоено воинское звание подполковник.

Особенности преподавания: Образовательный курс нацелен на приобретение слушателями знаний, умений и навыков, достаточных для самостоятельного улучшения различных процессов, протекающих в бизнес-среде, предприятиях и организациях, с дальнейшей возможностью создания соответствующего enterprise решения или программного продукта.

В современных информационных технологиях повсеместно используются данные об управляющем объекте или процессе. С учетом того, что из года в год объём этих данных увеличивается, а скорость их восприятия человеком относительно постоянна, конкурентные преимущества имеет тот, кто лучше и быстрее извлекает полезную для него информацию. Применение методологии Data Science в программном продукте позволяет значительно повысить его качество и эффективность, что приводит к увеличению прибыли и сокращению затрат организации. Потому руководители предприятия или организации готовы платить немалые деньги тем, кто знает Data Science и умеет  воплощать ее методологию в жизнь.

Для успешного освоения курса слушателям необходимо иметь знания высшей математики на уровне 1-2 курса технического или математического высшего учебного заведения, а также владеть начальными навыками программирования, преимущественно на языке Python.

Почему выбирают IT-академию?

Программа обучения очень насыщенная

На курс по Data Science записался, поскольку начал интересоваться этой областью. До этого изучил язык программирования Python и думал, как можно его применить. Собственно, это и привело меня в IT-Academy. Прошёл отбор. Входные задания мне показались интересными, но не очень сложными. Наверное, потому что уже была база. 

Курс сложный, но дал много новых и полезных знаний

Пришёл на курс с целью сменить сферу деятельности, связать свою карьеру с машинным обучением и Data Science. Образовательный центр ПВТ предлагает основательную программу обучения по Data Science.

На курс по Data Science записался, поскольку начал интересоваться этой областью. До этого изучил язык программирования Python и думал, как можно его применить. Собственно, это и привело меня в IT-Academy. Прошёл отбор. Входные задания мне показались интересными, но не очень сложными. Наверное, потому что уже была база. 

А вот сама программа обучения – очень насыщенная, всё шло плотнячком, времени расслабляться не было. Но здесь нужно понимать, что Data Science – довольно широкая область и углубляться в ней можно бесконечно. На курсе мы получили основы, были интересные задания. Впечатления остались самые положительные.

Пришёл на курс с целью сменить сферу деятельности, связать свою карьеру с машинным обучением и Data Science. Образовательный центр ПВТ предлагает основательную программу обучения по Data Science. Увидел это и решил: почему бы не попробовать? Входные тесты дались нормально, у меня математическое образование, с программированием тоже дружу, поэтому особых проблем не возникло. 

Курс в целом достаточно сложный, потребовал много усилий, но дал много новых и полезных знаний. В том числе и в программировании. Программа обучения полностью оправдала мои ожиданий. Теперь намерен искать работу в области Data Science и связать дальнейшую карьеру с этим направлением.

Более 3150 выпускников успешно работают в IT-компаниях в Беларуси и за рубежом

Акции и новости