The English encyclopedia Allmultimedia.org will be launched in two phases.
The final launch of the Allmultimedia.org will take place on February 24, 2026
(shortly after the 2026 Winter Olympics).


Dovolená : 23. prosinec 2025 — 29. prosinec 2025
Holidays : December 23, 2025 — December 29, 2025

Analýza hlavních komponent

Z Multimediaexpo.cz

(Rozdíly mezi verzemi)
m (1 revizi)
(+ Aktualizace)
 
Řádka 1: Řádka 1:
-
{{Wikipedia-cs|Analýza hlavních komponent|700}}
+
'''Analýza hlavních komponent''' (''{{Cizojazyčně|en|Principal Component Analysis}}'', '''PCA''') je v [[teorie signálu|teorii signálu]] [[transformace]] sloužící k dekorelaci [[data|dat]]. Často se používá ke [[snížení dimenze]] dat s co nejmenší ztrátou [[informace]].<ref>{{Citace elektronického periodika
 +
| titul = Martin Sebera - FSpS MU - Vícerozměrné statistické metody
 +
| periodikum = www.fsps.muni.cz
 +
| url = https://www.fsps.muni.cz/~sebera/vicerozmerna_statistika/pca.html
 +
| datum přístupu = 2022-01-17
 +
| url archivu = https://web.archive.org/web/20220302060409/https://www.fsps.muni.cz/~sebera/vicerozmerna_statistika/pca.html
 +
| datum archivace = 2022-03-02
 +
}}</ref> PCA je možno najít také jako Karhunen-Loèveho transformaci, Hotellingovu transformaci, nebo jako [[singulární rozklad]] (SVD; v [[Lineární algebra|lineární algebře]]).
 +
Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné [[souřadná soustava|souřadné soustavy]]:
 +
 +
<big>\(Y = X P\)</big>
 +
 +
kde ''X'' je centrovaná matice ''n'' ''x'' ''d'' se vstupními ''d''-rozměrnými daty v ''n'' řádcích, ''Y'' obdobná matice výstupních dat,
 +
''P'' je ''d'' ''x'' ''d'' matice [[vlastní vektor|vlastních vektorů]] [[kovariance|kovarianční matice]] <big>\(C_X\)</big> splňující vztah <big>\(C_X = P \Lambda P^T\)</big>, kde <big>\(\Lambda\)</big> je [[diagonální matice]] obsahující na diagonále vlastní&nbsp;čísla <big>\(C_X\)</big> a matice vlastních vektorů <big>\(P\)</big> je ortonormální, tj. <big>\(P^T P = I_d\)</big>, kde
 +
<big>\(I_d\)</big> je [[jednotková matice]] dimenze <big>\(d\)</big>.
 +
 +
Vlastní vektory (sloupce matice ''P'') tvoří onu novou souřadnou soustavu.
 +
Centrování matice ''X'' dosáhneme odečtením příslušného [[Výběrový průměr|výběrového průměru]] od každého sloupce.
 +
{{RIGHTTOC}}
 +
== Odvození ==
 +
Matice ''Y'' je zřejmě také centrovaná, tj. [[aritmetický průměr]] každého jejího sloupce je 0.<ref>{{Citace elektronického periodika |titul=Archivovaná kopie |url=https://k101.unob.cz/~neubauer/pdf/ekon_PCA.pdf |datum přístupu=2022-01-17 |url archivu=https://web.archive.org/web/20220118182931/https://k101.unob.cz/~neubauer/pdf/ekon_PCA.pdf |datum archivace=2022-01-18 }}</ref>
 +
 +
Spočítáme, jak musí vypadat kovarianční matice nových dat ''Y'':
 +
 +
<big>\(C_Y = E(Y^T Y) = E[(X P)^T (XP)] = E (P^T X^T X P) = P^T E(X^T X) P = P^T C_X P = P^T P \Lambda P^T P = \Lambda.\)</big>
 +
 +
Vzhledem k tomu, že matice <big>\(\Lambda\)</big> je diagonální,
 +
 +
<big>\(C_Y = \Lambda = \left ( \begin{matrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_d  \\ \end{matrix}\right ), \)</big>
 +
 +
vidíme, že sloupce matice ''Y'' jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.
 +
 +
== Použití ==
 +
Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel <big>\(\lambda_i\)</big>, budeme
 +
dostávat složky v ''Y'' setříděné podle rozptylu. Pokud chceme snížit dimenzi dat,
 +
stačí z ''Y'' vzít jen tolik prvních složek kolik uznáme za vhodné. Vybírání
 +
komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud
 +
máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které
 +
tímto postupem zahodíme.
 +
 +
=== Rozpoznávání ===
 +
V [[rozpoznávání]] slouží PCA jako jedna z tzv. ''Feature Extraction metod'' ([[extrakce rysů]]).
 +
Používají ji například kriminalisté pro rozpoznávání obličejů.
 +
 +
=== Komprese ===
 +
Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké [[korelace]] mezi jednotlivými spektrálními kanály a převede
 +
obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.
 +
 +
== Související články ==
 +
* [[singulární rozklad]]<ref>{{Citace elektronického periodika
 +
| titul = dimensionality reduction - Relationship between SVD and PCA. How to use SVD to perform PCA?
 +
| periodikum = Cross Validated
 +
| url = https://stats.stackexchange.com/questions/134282/relationship-between-svd-and-pca-how-to-use-svd-to-perform-pca
 +
| datum přístupu = 2022-01-17
 +
}}</ref>
 +
* [[samoorganizující síť]]
 +
 +
== Reference ==
 +
<references />
 +
== Externí odkazy ==
 +
* http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf — jednoduché vysvětlení PCA spolu s matematickým základem
 +
* https://web.archive.org/web/20040809034742/http://robotics.eecs.berkeley.edu/~rvidal/cvpr03-gpca-final.pdf — vysvětlení pokročilejší zobecněné PCA
 +
* [https://web.archive.org/web/20070318013042/http://www.reindeergraphics.com/foveapro/pca.shtml Příklady využití analýzy hlavních komponent na zřetelnější zobrazení struktur u grafických souborů] (anglicky)
 +
 +
 +
{{Commonscat|Principal component analysis}}{{Článek z Wikipedie}}
[[Kategorie:Statistika]]
[[Kategorie:Statistika]]
[[Kategorie:Strojové učení]]
[[Kategorie:Strojové učení]]
[[Kategorie:Zpracování obrazu]]
[[Kategorie:Zpracování obrazu]]

Aktuální verze z 20. 4. 2025, 08:48

Analýza hlavních komponent (Principal Component Analysis, PCA) je v teorii signálu transformace sloužící k dekorelaci dat. Často se používá ke snížení dimenze dat s co nejmenší ztrátou informace.[1] PCA je možno najít také jako Karhunen-Loèveho transformaci, Hotellingovu transformaci, nebo jako singulární rozklad (SVD; v lineární algebře).

Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné souřadné soustavy:

\(Y = X P\)

kde X je centrovaná matice n x d se vstupními d-rozměrnými daty v n řádcích, Y obdobná matice výstupních dat, P je d x d matice vlastních vektorů kovarianční matice \(C_X\) splňující vztah \(C_X = P \Lambda P^T\), kde \(\Lambda\) je diagonální matice obsahující na diagonále vlastní čísla \(C_X\) a matice vlastních vektorů \(P\) je ortonormální, tj. \(P^T P = I_d\), kde \(I_d\) je jednotková matice dimenze \(d\).

Vlastní vektory (sloupce matice P) tvoří onu novou souřadnou soustavu. Centrování matice X dosáhneme odečtením příslušného výběrového průměru od každého sloupce.

Obsah

Odvození

Matice Y je zřejmě také centrovaná, tj. aritmetický průměr každého jejího sloupce je 0.[2]

Spočítáme, jak musí vypadat kovarianční matice nových dat Y:

\(C_Y = E(Y^T Y) = E[(X P)^T (XP)] = E (P^T X^T X P) = P^T E(X^T X) P = P^T C_X P = P^T P \Lambda P^T P = \Lambda.\)

Vzhledem k tomu, že matice \(\Lambda\) je diagonální,

\(C_Y = \Lambda = \left ( \begin{matrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_d \\ \end{matrix}\right ), \)

vidíme, že sloupce matice Y jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.

Použití

Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel \(\lambda_i\), budeme dostávat složky v Y setříděné podle rozptylu. Pokud chceme snížit dimenzi dat, stačí z Y vzít jen tolik prvních složek kolik uznáme za vhodné. Vybírání komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které tímto postupem zahodíme.

Rozpoznávání

V rozpoznávání slouží PCA jako jedna z tzv. Feature Extraction metod (extrakce rysů). Používají ji například kriminalisté pro rozpoznávání obličejů.

Komprese

Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké korelace mezi jednotlivými spektrálními kanály a převede obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.

Související články

Reference

  1. Martin Sebera - FSpS MU - Vícerozměrné statistické metody. www.fsps.muni.cz [online].  [cit. 2022-01-17]. Dostupné online.  
  2. Archivovaná kopie.  [cit. 2022-01-17]. Dostupné online.
     
  3. dimensionality reduction - Relationship between SVD and PCA. How to use SVD to perform PCA?. Cross Validated [online].  [cit. 2022-01-17]. Dostupné online.  

Externí odkazy


Commons nabízí fotografie, obrázky a videa k tématu
Analýza hlavních komponent