Одним из ключевых требований к специалисту по данным является математика и статистика. От понимания данных до преобразования их в ценную информацию для бизнеса и ее понимания до статистики деловых людей — очень важный аспект науки о данных.

ОСНОВЫ математики. В основах математики, как специалист по данным, мы должны быть знакомы с функциями, которые включают логарифмические, полиномиальные и экспоненциальные функции. Мы должны знать основы логарифмирования, которые мы изучали до 10 класса. Мы также должны иметь четкое представление о теоремах геометрии и тригонометрии и должны знать, что такое действительные и комплексные числа и т. д.

Исчисление. Проще говоря, исчисление — это раздел математики, который имеет дело со скоростью изменения. Например. В машинном обучении Градиент достойный (градиент измеряет, насколько изменится результат функции, если вы немного измените ввод) является одним из примеров исчисления в науке о данных. В мире науки о данных исчисление имеет 20% веса, в котором исчисление состоит из двух основных частей: дифференциального исчисления и интегрального исчисления. Темы, с которыми мы должны быть знакомы: функции одной переменной, предел, непрерывность, дифференцируемость, теорема о среднем значении, неопределенные формы, правило Лопиталя, максимумы и минимумы, бета- и гамма-функция, функция нескольких переменных, частная производная, Основы обыкновенного уравнения и уравнения в частных производных.

Статистика и вероятность. Одна из самых важных вещей в мире данных — это статистика и вероятность. Независимо от того, в какой области данных вы работаете, вы должны быть знакомы со статистикой и вероятностью. Статистика — наука о сборе, анализе, представлении и интерпретации данных. Здесь, в статистике, мы должны быть знакомы со следующими понятиями: сводки данных и описательная статистика, теорема о центральной тенденции, дисперсия, ковариация, корреляция, выборка, измерение. , ошибка, генерация случайных чисел, проверка гипотез, A/B-тестирование, линейная регрессия и т. д. Вероятность позволяет ученым, работающим с данными, получить доступ к достоверности результатов конкретного исследования или эксперимента. Что касается вероятности, мы должны быть знакомы с основными понятиями вероятности, а также с центральной предельной теоремой, теоремой Бая, предельной вероятностью, совместной вероятностью, условной вероятностью и т. д.

Линейная алгебра. Линейная алгебра становится изучением основной операции линейной комбинации и потенциально может использоваться как дескриптор большого набора данных. -школа, которая включает в себя основные свойства матрицы и векторов, скалярное умножение, линейное преобразование, транспонирование матрицы, внутренние и внешние произведения, правило умножения матриц, обратную матрицу, концепцию матричной факторизации, исключение Гаусса, собственные значения, собственные векторы, диагонализацию, сингулярное значение разложение и др.

МОЕ МНЕНИЕ: В основном все вышеперечисленные части важно понимать, чтобы стать действительно хорошим специалистом по данным, но нам не нужно получать докторскую степень по любой из вышеперечисленных тем, нам просто нужно понимать их с основ. поэтому мы можем понять, что на самом деле происходит под капотом, когда какая-то модель машинного обучения обучается, чтобы мы могли лучше понять решение и конечный результат. Теперь, если вы хотите быть инженером данных, вам не нужно так много математических знаний, и если вы хотите быть специалистом по данным, вам нужно иметь столько знаний в области математики, и если вы хотите быть инженером по машинному обучению, вам нужно больше чем эта большая часть математики. В конце концов роль, над которой вы работаете, решит, сколько математики вам нужно для вашей роли…..

В конце концов, математика проста, и с практикой вы сможете ее понять…