Korelace je statistický pojem, který popisuje míru vztahu mezi dvěma nebo více proměnnými. Jestliže jedna proměnná ovlivňuje nebo souvisí s druhou, můžeme mluvit o korelaci mezi nimi. Korelace se využívá k posouzení, jak velký vztah mají tyto proměnné vůči sobě, což je užitečné ve výzkumu, analýze dat, ekonomii, medicíně a mnoha dalších oborech.
Když jedna proměnná zvyšuje svou hodnotu a druhá proměnná rovněž zvyšuje svou hodnotu, jedná se o pozitivní korelaci. Například, čím více lidí investuje do marketingu, tím vyšší mohou být jejich prodeje.
Opakem je negativní korelace, kde se při zvyšování hodnoty jedné proměnné snižuje hodnota druhé proměnné. Příkladem může být vztah mezi kouřením a zdravím plic; čím více člověk kouří, tím horší zdravotní stav plic pravděpodobně má.
Pokud mezi proměnnými neexistuje žádný vztah, mluvíme o nulové korelaci. To znamená, že změny v jedné proměnné nemají žádný systematický vztah ke změnám v druhé proměnné, jako například mezi barvou auta a jeho spolehlivostí.
Jedním z nejčastěji používaných statistických nástrojů pro měření síly a směru lineární korelace mezi dvěma proměnnými je Pearsonův korelační koeficient. Hodnota tohoto koeficientu může nabývat od -1 (perfektní negativní korelace) přes 0 (žádná korelace) až po +1 (perfektní pozitivní korelace).
Pro data, která nejsou normálně rozdělená nebo když vztahy nejsou lineární, může být vhodnější použít Spearmanův korelační koeficient. Tento koeficient pracuje s pořadovými čísly namísto skutečných hodnot a je tedy robustnější vůči výstřelkům ve datech.
Korelace se široce používá k odhalování vztahů mezi proměnnými, což může pomoci v předpovídání jedné proměnné na základě druhé. Je však důležité si uvědomit, že korelace neimplikuje kauzalitu. Jinými slovy, i když dvě proměnné korelují, neznamená to nutně, že jedna způsobuje změny v druhé. Mohou existovat skryté proměnné nebo vnější faktory, které ovlivňují obě měřené proměnné.
Porozumění korelaci je klíčové pro analýzu dat a rozhodování v mnoha oborech. Korelační analýza poskytuje cenné vhledy, ale je třeba ji používat opatrně a s plným uvědoměním jejích omezení, zejména pokud jde o rozlišení mezi korelací a kauzalitou.