Regrese vs korelace
Ve statistice je důležité určit vztah mezi dvěma náhodnými proměnnými. Dává schopnost dělat předpovědi o jedné proměnné ve srovnání s ostatními. Regresní analýza a korelace se používají v předpovědích počasí, chování na finančních trzích, vytváření fyzikálních vztahů pomocí experimentů a v mnohem reálnějších scénářích.
Co je to regrese?
Regrese je statistická metoda používaná k vykreslení vztahu mezi dvěma proměnnými. Při shromažďování údajů často mohou existovat proměnné, které jsou závislé na ostatních. Přesný vztah mezi těmito proměnnými lze určit pouze pomocí regresních metod. Určení tohoto vztahu pomáhá pochopit a předvídat chování jedné proměnné vůči druhé.
Nejběžnější aplikací regresní analýzy je odhadnout hodnotu závislé proměnné pro danou hodnotu nebo rozsah hodnot nezávislých proměnných. Například pomocí regrese můžeme určit vztah mezi cenou komodity a spotřebou na základě údajů shromážděných z náhodného vzorku. Regresní analýza vytváří regresní funkci datové sady, což je matematický model, který nejlépe odpovídá dostupným datům. To lze snadno vyjádřit bodovým grafem. Graficky je regrese ekvivalentní nalezení nejlepší křivky pro danou datovou sadu. Funkce křivky je regresní funkcí. Pomocí matematického modelu lze předpovědět poptávku po komoditě za danou cenu.
Proto je regresní analýza široce používána při předpovídání a předpovídání. Používá se také k navázání vztahů v experimentálních datech v oblastech fyziky, chemie a mnoha přírodních a technických věd. Pokud je relace nebo regresní funkce lineární funkcí, pak je proces známý jako lineární regrese. V bodovém grafu může být reprezentován jako přímka. Pokud funkce není lineární kombinací parametrů, je regrese nelineární.
Co je korelace?
Korelace je měřítkem síly vztahu mezi dvěma proměnnými. Korelační koeficient kvantifikuje stupeň změny v jedné proměnné na základě změny v druhé proměnné. Ve statistice je korelace spojena s konceptem závislosti, což je statistický vztah mezi dvěma proměnnými.
Pearsonův korelační koeficient nebo jen korelační koeficient r je hodnota mezi -1 a 1 (-1≤r≤ + 1). Je to nejčastěji používaný korelační koeficient a platí pouze pro lineární vztah mezi proměnnými. Pokud r = 0, neexistuje žádný vztah, a pokud r≥0, je vztah přímo úměrný; tj. hodnota jedné proměnné se zvyšuje s nárůstem druhé. Pokud je r≤0, vztah je nepřímo úměrný; tj. jedna proměnná klesá s rostoucí druhou.
Kvůli podmínce linearity lze korelační koeficient r také použít ke stanovení přítomnosti lineárního vztahu mezi proměnnými.
Jaký je rozdíl mezi regresí a korelací?
Regrese dává formu vztahu mezi dvěma náhodnými proměnnými a korelace dává stupeň síly vztahu.
Regresní analýza vytváří regresní funkci, která pomáhá extrapolovat a předvídat výsledky, zatímco korelace může poskytnout pouze informace o tom, jakým směrem se může změnit.
Přesnější lineární regresní modely jsou dány analýzou, pokud je korelační koeficient vyšší. (| r | ≥0,8)