Давайте сделаем обучение науке о данных эффективным и результативным!

Введение

Всем привет! Спасибо, что прочитали мою статью.

Каждый год количество студентов, профессионалов, вступающих в науку о данных, увеличивается в геометрической прогрессии. Почти все следуют одной и той же учебной программе для изучения науки о данных, которая больше концентрируется на Python, алгоритмах машинного обучения, и в настоящее время импульс больше склоняется к НЛП и глубокому обучению (иногда это хорошо, но более простые, интересные и важные области исключаются).

Несмотря на то, что существует множество ресурсов и структурированных учебных программ, многие новички изо всех сил пытаются изучить их должным образом и создать демонстративный набор навыков. Основной причиной может быть случайное и рассеянное обучение. Это заставляет их по-прежнему находиться в зоне Fresher вместо того, чтобы двигаться вперед к практикующему специалисту / соискателю с зоной набора навыков.

В этой статье мы обсудим наиболее эффективные способы изучения Data Science и связанных с ней областей. Это может быть применимо и к любым другим областям, но у нас будут примеры по науке о данных.

Сказав это, давайте углубимся в тему!

Подготовьте среду для обучения и практики

Прежде чем приступить к изучению каких-либо концепций науки о данных, убедитесь, что настроены следующие вещи.

  1. Учебная программа и план
  2. Система поддержки обучения
  3. Практическая среда

Учебный план:

Выбор правильной справочной учебной программы станет отличным стартом в процессе обучения. Вместо случайных / неполных видеороликов на YouTube предлагается следовать стандартной учебной программе, разработанной либо университетом, либо установленными учебными платформами, такими как Coursera, Udemy, LinkedIn Learning, upGrad.

Упомянутые выше места легкодоступны, а учебную программу можно бесплатно скачать/доступ к ней. Убедитесь, что у вас есть учетная запись в нем.

Несколько стандартных учебных программ по науке о данных, которые я предпочитаю:

  1. https://www.coursera.org/specializations/jhu-data-science
  2. https://www.coursera.org/specializations/applied-data-science
  3. https://www.coursera.org/specializations/data-science-python

Если бы вы могли позволить себе купить курсы, вы можете приобрести их в противном случае, вы можете прослушать курсы, но, учитывая структурированную учебную программу, в любом случае это поможет.

Система поддержки обучения:

Система поддержки обучения — это не что иное, как сообщество Data Science Community, которое распространено по всему миру и доступно через LinkedIn, Twitter, Medium. Связь с этими сообществами даст нам надежду, руководство, последние обновления, помощь.

Попробуйте создать профиль Linkedin (даже если вы находитесь на нулевой вехе), учетную запись Medium, чтобы следить за хэштегами (темами), такими как #datascience #dataanalytics #machinelearning #statistics #datastorytelling #dataengineering. Это поможет получить интересные темы для изучения, статьи, которые объясняют концепции более простым способом.

Практическая среда:

Игроки могут только блистать на этом поле (почти любой домен), Зрители здесь не выдержат! Просмотр видео на YouTube или просмотр статей не помогут перейти к следующему этапу. Как мы всегда подчеркиваем, обучение на практике — один из ключей к успеху. Для этого должна быть обеспечена среда для практики. Требуются IDE Neccassy (Pycharm, Visual Studio Code), серверы для ноутбуков

Большую часть времени мы используем ноутбуки Jupyter для практики, поэтому можно установить JupyterNotebook с помощью Anaconda Navigator, настроить свои учетные записи Kaggle или Colab для использования экземпляров GPU.

AWS запустила бесплатную лабораторию AWS Sagemaker Studio, в которой мы можем бесплатно изучать существующие курсы вместе с учебными пособиями на основе ноутбуков.

DataSpell — это эксклюзивная IDE для специалистов по данным, запущенная JetBrains (я предпочитаю это)

https://studiolab.sagemaker.aws/



Планируйте, отслеживайте и оценивайте!

Прежде чем приступить к обучению, разделите указанную выше учебную программу на несколько спринтов (рассмотрите свое свободное время для обучения, если вы работаете).

  1. Для каждого спринта определите как минимум две цели и их ключевые результаты. Например, если вашей целью на январь 2022 года является изучение Pandas, Matplotlib, вашими ключевыми результатами должны быть: а) пройти курс анализа и визуализации данных Kaggle, б) создать презентацию EDA и Data Storytelling для двух тематических исследований ( Опрос вовлеченности клиентов, продажи в продуктовом магазине) c) Создать 2 записных книжки EDA на Kaggle с использованием открытых наборов данных
  2. В приведенном выше примере ключевые результаты должны поддаваться количественной оценке и всегда должны отслеживаться.
  3. Проводите личную каденцию / обзор своего прогресса каждую неделю. Если вы обнаружите какие-либо задержки, выясните причину и запишите ее. Не переоценивайте свою работу
  4. Отслеживайте их все в структурированном шаблоне, чтобы ваше обучение можно было пересмотреть в любое время. Для этого используйте Notion (https://www.notion.so/).
  5. Вы можете создать учебный журнал, используя понятие, где вы можете записывать все свои знания и сохранять важные заметки, ссылки, ресурсы (это поможет во время интервью и быстрых изменений. Мне это помогло на этапе разработки проектного предложения)

Совместное изучение математических концепций и программирования:

Большую часть времени программирование изучается самостоятельно, без какого-либо сотрудничества с математическими концепциями (большинство учебных программ колледжей разработаны таким образом — уроки математики / статистики должны изучаться вместе с программированием).

Если вы изучаете какие-либо математические концепции, попробуйте преобразовать их в функции или классы Python. Это улучшит лучшие практики кодирования, а при написании формул/алгоритмов в простом коде Python поможет понять корни.

Например, если вы изучаете распределения вероятностей, статистические тесты, попробуйте попрактиковаться в них с помощью Python тут же.

Изучите варианты использования тем, которые вы изучили, в реальном времени и запишите их в виде тематических исследований. Это поможет либо во время разработки задач, либо во время подготовки к интервью.

Воссоздайте и представьте более сложные темы: математика, статистика, алгоритмы машинного обучения:

Когда вы перейдете к камням миль, концепции станут более жесткими и подавляющими. Отдых и представление тем сделают обучение здесь эффективным.

Когда вы изучаете более сложные темы, алгоритмы и математическую интуицию, следуйте методу

  1. Соберите блоги, статьи, конспекты лекций, доступные по теме
  2. Извлечение основных понятий, формул, псевдокода
  3. Используйте реализации кода, чтобы понять реализацию в реальном времени
  4. Создайте из этого интуитивную историю, воссоздайте историю с помощью простых терминов неспециалиста.
  5. Объясните шаг формулы/алгоритма на более простом примере (нужно практиковаться снова и снова, это поможет заложить прочный фундамент)
  6. Представьте это как презентацию или документ и попытайтесь научить своих сверстников

Например: обратитесь к моей колоде по агентному моделированию https://docs.google.com/presentation/d/1jL5pipbAR_2m74-m1rzNunJEKzz0HwUb8rewbGe808s/edit?usp=sharing

Метод науки о данных + X:

Создание проектов и портфолио — главная цель в изучении науки о данных, что свидетельствует о вашем обучении и усилиях. Распространенная ошибка — шаблонные проекты и портфолио. Если вы строите проект на простых общих наборах данных, таких как «Титаник», предсказание цен на жилье в Бостоне, это не потребует от вас навыков работы с данными. Вместо того, чтобы придерживаться обычных портфолио проектов, попробуйте создать уникальное портфолио, которое потребует от вас постоянного обучения и дальнейшего изучения.

  1. Выберите домен X. Здесь X может быть доменом, связанным с вашей учебой в колледже, или областью ваших интересов (сельское хозяйство, строительство, городское планирование, управление стихийными бедствиями).
  2. Изучите сферу аналитики, науки о данных в выбранной области, соберите тематические исследования (чтобы вы также могли получить знания в области)
  3. Выясните существующие проблемы в выбранной области. Например, в области строительства есть несколько существующих проблем: 1. Ежемесячное планирование бюджета, 2. Оценка качества материалов / построенных частей здания, 3. Архитектурный план, 3. Участок выбор
  4. Возьмите одну конкретную проблему и соберите существующие решения либо из опубликованных статей, либо из тематических блогов.
  5. Реализуйте их, как указано в справочных документах, тематических исследованиях — это поможет вам научиться реализовывать решение для сохраняемости.
  6. Затем попробуйте привнести свой вкус в разработку функций, моделирование, настройку параметров.
  7. Оберните свой проект как общие сценарии Python и API (используйте Fast API / Flask или Streamlit для использования)
  8. Подготовьте документ, представьте свой проект на GitHub, LinkedIn, Medium и спросите предложения.

Учитесь на публике + создавайте на публике:

Обучение и развитие на публике — это принцип, который сделает вас более приверженным к вашей цели, что делает обучение более эффективным. Это метод, который позволит вам учиться быстрее, прислушиваясь к отзывам других. Нам нужно твитнуть о том, что мы узнали!

Это поможет отслеживать прогресс и коллективно анализировать полученные знания. Если вы изучаете очень уникальные концепции, такие как моделирование дискретных событий, моделирование на основе агентов, приложения машинного обучения для предметной области, Публичное обучение позволит вам связаться с экспертами и практиками через Twitter, LinkedIn.

Иногда руководство/оценка будет исходить от Создателей/Авторов. Когда я публиковал сообщения во время изучения GraphDatabase, я получил рекомендации и благодарность от команды neo4j и команды Arango DB.

Если вы сможете делать это последовательно, вы начнете получать отзывы, встречаться с экспертами и практиками и формировать онлайн-аудиторию.

Превратите свои знания в результаты:

Создание проектов по всем концепциям может быть утомительным, но мы можем писать об этом блоги, посты, карточки, шпаргалки. Принесите свой способ объяснения здесь!

Взаимодействуйте с сообществом:

Взаимодействие с сообществом специалистов по науке о данных поможет оценить позицию, это даст другую точку зрения, как другие решают проблемы? Какие инструменты и технологии используются?

Занятия в Club House — отличный способ пообщаться с отраслевыми экспертами, чтобы узнать эти вещи и помочь преодолеть разрыв в знаниях и знакомстве. Это также устраняет барьер общения и доступности. Я видел, как многие люди больше внимания уделяют слепому обучению НЛП сразу.

Твиттер — это место, где технологические компании, участники с открытым исходным кодом и исследовательские фонды объявляют обо всех обновлениях.

Посещайте виртуальные встречи, организованные группой пользователей Tensorflow, Mircosoft Reactor, группой разработчиков Google и т. д.

Заключительные примечания:

Надеяться! Эта статья поможет вам и даст ценные идеи.

До сих пор мы обсуждали множество способов изучения науки о данных эффективным и действенным образом, который принесет высокую отдачу. Если вы не можете следовать всем упомянутым способам, можно следовать некоторым из них.

Небольшая адаптация поможет сделать переход лучше и эффектнее.

Если вам понравилась эта статья, хлопайте в ладоши, поделитесь ею с друзьями и сверстниками

Отзывы, комментарии приветствуются!

Оставайтесь со мной, чтобы не пропустить интересные статьи на разные темы!

#Учитесь с Караном #УчимсяВместе #РастемВместе

Кому обо мне — проверьте мой профиль Linkedin

https://www.linkedin.com/in/prabakaranchandrantheds/