Логистическая регрессия: от линейных отношений к двоичным классификациям (с полным объяснением)

вступление
Краткий обзор линейной регрессии
Что такое логистическая регрессия
Почему логистическая регрессия эффективна
Как интерпретировать логистическую регрессию
Заключение

вступление

Прежде чем углубляться в логистическую регрессию, давайте рассмотрим формулы линейной регрессии и логистической регрессии.

На графике выше мы можем видеть, что логистическая регрессия использует выходные данные линейной регрессии в качестве входных данных для сигмовидной функции. Прежде чем мы перейдем к логистической регрессии, давайте кратко вспомним, что такое линейная регрессия:

Краткий обзор — линейная регрессия

Линейная регрессия используется для прогнозирования непрерывного числового результата на основе входных функций. Он предполагает линейную связь между входными функциями и выходными данными. Уравнение модели в линейной регрессии имеет вид:

где:

y — непрерывный выход.
x1,x2,…,xn — входные объекты.
β0,β1,…,βn — коэффициенты, подлежащие оценке.
ε представляет собой ошибку.

Более подробную информацию о линейной регрессии я объясню в другой статье. Прямо сейчас давайте подробно рассмотрим, чем логистическая регрессия отличается от линейной регрессии и как она связана с ней.

Что такое логистическая регрессия

С другой стороны, логистическая регрессия используется для бинарной классификации, которая предполагает прогнозирование одного из двух классов (0 или 1). Хотя это и называется «регрессией», оно не позволяет напрямую прогнозировать непрерывный результат. Вместо этого он моделирует вероятность того, что данный вход принадлежит определенному классу. Модель логистической регрессии использует логистическую функцию (также называемую сигмовидной функцией) для преобразования линейной комбинации входных функций:

где P(y=1∣x) — вероятность того, что выходной сигнал равен 1 с учетом входных функций.

В логистической регрессии:

Линейная комбинация β0+β1x1+β2x2+…+βnxn часто называют «логитом».
Логистическая функция 1/(1+e^(-logit)) преобразует логит в значение вероятности от 0 до 1.

Функция logit отображает y как сигмовидную функцию x. Итак, хотя логистическая регрессия использует концепцию линейной комбинации входных функций, такую как линейная регрессия, преобразование с помощью логистической функции фундаментально меняет ее цель и характеристики, что делает ее подходящей для задач двоичной классификации.

Почему логистическая регрессия эффективна

Интерпретируемость. Логистическая регрессия дает интерпретируемые результаты, позволяя понять влияние каждой предикторной переменной на вероятность бинарного результата. Коэффициенты переменных-предсказателей дают представление о направлении и величине их воздействия.
Оценка вероятности. Модели логистической регрессии напрямую оценивают вероятность двоичного результата, что полезно, когда вам нужно оценить вероятность возникновения события.
Эффективность. Логистическая регрессия эффективна в вычислительном отношении и может обрабатывать большое количество переменных-предикторов. Он не требует сложных вычислений по сравнению с некоторыми другими алгоритмами машинного обучения.

Как интерпретировать логистическую регрессию

Интерпретация вывода

Сигмоидальная функция будет отображать выходное целевое значение как вероятность в пределах [0, 1], которую мы можем использовать для простой двоичной классификации. Например: P(y=1|x) > 0,5, затем прогнозируем y как 1. И наоборот, P(y=0|x) ‹ 0,5, затем прогнозируем y как 0.

Коэффициент интерпретации

Из Python/R мы можем легко распечатать сводную информацию логистической регрессии, чтобы увидеть коэффициент и их значения p, чтобы увидеть, значимы они или нет. И да, будьте осторожны с интерпретацией, если присутствует мультиколлинеарность, поскольку она может повлиять на стабильность и интерпретируемость коэффициентов.

Заключение

В заключение отметим, что логистическая регрессия — это мощный и универсальный метод в области машинного обучения. Он отличается от линейной регрессии тем, что ориентирован на бинарную классификацию, цель которой — предсказать один из двух классов (0 или 1). В отличие от линейной регрессии, которая прогнозирует непрерывный числовой результат, логистическая регрессия моделирует вероятность того, что данные входные данные принадлежат определенному классу.

В целом, сочетание интерпретируемости, оценки вероятности и вычислительной эффективности логистической регрессии делает ее ценным инструментом для различных задач двоичной классификации. Понимая механику и элементы интерпретации логистической регрессии, вы можете использовать ее возможности для принятия обоснованных решений в приложениях, управляемых данными.

Ссылка:

Что такое логистическая регрессия? - Объяснение модели логистической регрессии - AWS
Что такое логистическая регрессия, как и почему компании используют логистическую регрессию и как использовать логистическую регрессию с…aws.amazon.com

Что такое логистическая регрессия? | IBM
Что такое логистическая регрессия? Узнайте, как эта аналитическая процедура может помочь вам быстрее прогнозировать результаты и…www.ibm.com

материалы по теме:

Новые материалы

Журналы Py № 2: Если, Элиф, Иначе?

У меня такое чувство, будто я давно ничего не писал, хотя прошло два дня с тех пор, как я опубликовал свою первую историю. В любом случае, сегодня произошло много всего, так что приступим...

Работа в Реакции

Я изучаю React в Bloc прямо сейчас. До сих пор я изо всех сил пытался понять темы. Тем не менее, я только что закончил проблему, над которой некоторое время размышлял, и хочу записать свой..

Нужен ли банкам искусственный интеллект, чтобы кардинально изменить свою работу?

Почему необходимо использовать искусственный интеллект в банковской сфере? Существенное использование многочисленных инноваций ИИ, таких как машинное обучение , глубокое обучение и..

Какую последнюю статью вы считаете стоящей поделиться?

Я люблю читать качественные статьи. Не стесняйтесь делиться своей работой.

Преобразование CoreML, позволяющее использовать Fast-Neural-Style-Transfer на iOS и MacOS.

Как использовать Fast-Neural-Style-Transfer на iOS Преобразованная модель: GitHub — john-rocky/CoreML-Models: Преобразованный зоопарк моделей CoreML...

ИИ в правоохранительных органах: мощный инструмент с двойной природой

Искусственный интеллект (ИИ) революционизирует правоохранительную деятельность, предлагая инновационные тактики расследования, повышая достоверность доказательств и оптимизируя процессы. Тем..

Autoencoder Average Distance — классический способ, используемый внутри Microsoft для выявления сходства…

Среднее расстояние автоэнкодера (AAD) использует более простой подход для определения расстояния между двумя наборами данных. Нейронный автоэнкодер может преобразовать любой элемент данных в..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI React Software Engineering Nodejs Tech Java Development Front End Development Algorithms Typescript Tutorial HTML Computer Science Data Learning ChatGPT Programming Languages CSS Javascript Tips Statistics NLP Computer Vision Neural Networks Learning To Code Code Business React Native Angular Golang