Lineární vs logistická regrese
Ve statistické analýze je důležité identifikovat vztahy mezi proměnnými, kterých se studie týká. Někdy to může být jediný účel samotné analýzy. Jedním ze silných nástrojů používaných k prokázání existence vztahu a jeho identifikaci je regresní analýza.
Nejjednodušší formou regresní analýzy je lineární regrese, kde vztah mezi proměnnými je lineární vztah. Ze statistického hlediska přináší vztah mezi vysvětlující proměnnou a proměnnou odezvy. Například pomocí regrese můžeme určit vztah mezi cenou komodity a spotřebou na základě údajů shromážděných z náhodného vzorku. Regresní analýza vytvoří regresní funkci datové sady, což je matematický model, který nejlépe vyhovuje dostupným datům. To lze snadno vyjádřit bodovým grafem. Grafická regrese je ekvivalentní k nalezení nejvhodnější křivky pro danou sadu dat. Funkce křivky je regresní funkcí. Pomocí matematického modelu lze předpovědět využití komodity za danou cenu.
Proto je regresní analýza široce používána při předpovídání a předpovídání. Používá se také k navázání vztahů v experimentálních datech, v oblastech fyziky, chemie a v mnoha přírodních vědách a technických oborech. Pokud je relace nebo regresní funkce lineární funkcí, pak je proces známý jako lineární regrese. V bodovém grafu může být reprezentován jako přímka. Pokud funkce není lineární kombinací parametrů, je regrese nelineární.
Logistická regrese je srovnatelná s vícerozměrnou regrese a vytváří model vysvětlující dopad více prediktorů na proměnnou odezvy. V logistické regrese by však proměnná konečného výsledku měla být kategorická (obvykle rozdělená, tj. Dvojice dosažitelných výsledků, jako je smrt nebo přežití, ačkoli speciální techniky umožňují modelovat kategorizovanější informace). Kontinuální výsledná proměnná může být transformována do kategorické proměnné, která bude použita pro logistickou regresi; sbalení spojitých proměnných tímto způsobem se však většinou nedoporučuje, protože to snižuje přesnost.
Na rozdíl od lineární regrese, směrem k průměru, nemusí být proměnné prediktorů v logistické regrese nuceny k tomu, aby byly lineárně spojeny, běžně distribuovány nebo aby měly stejnou odchylku uvnitř každého klastru. Výsledkem je, že vztah mezi prediktorem a výslednými proměnnými pravděpodobně nebude lineární funkcí.
Jaký je rozdíl mezi logistickou a lineární regresí?
• U lineární regrese se předpokládá lineární vztah mezi vysvětlující proměnnou a proměnnou odezvy a analýzou se naleznou parametry vyhovující modelu, aby se získal přesný vztah.
• U kvantitativních proměnných se provádí lineární regrese a výsledná funkce je kvantitativní.
• V logistické regrese mohou být použitá data buď kategorická, nebo kvantitativní, ale výsledek je vždy kategorický.