Multimediaexpo.cz je již 18 let na českém internetu !!
Giniho koeficient
Z Multimediaexpo.cz
(+ Nový článek) |
m (Nahrazení textu „</math>“ textem „\)</big>“) |
||
(Není zobrazena jedna mezilehlá verze.) | |||
Řádka 6: | Řádka 6: | ||
Giniho koeficient většinou definujeme jako poměr plochy mezi [[Lorenzova křivka|Lorenzovou křivkou]] a diagonálou jednotkového čtverce ('''A''') ku celkové ploše pod diagonálou ('''A+B'''), tedy | Giniho koeficient většinou definujeme jako poměr plochy mezi [[Lorenzova křivka|Lorenzovou křivkou]] a diagonálou jednotkového čtverce ('''A''') ku celkové ploše pod diagonálou ('''A+B'''), tedy | ||
- | < | + | <big>\(GC=\frac{A}{A+B}.\)</big> |
Protože obsah plochy pod diagonálou je polovina jednotkového čtverce, můžeme definici přepsat jako '''GC=2A''' nebo také '''GC=1-2B'''. Odtud použitím posledního jmenovaného výrazu dostáváme matematický vztah | Protože obsah plochy pod diagonálou je polovina jednotkového čtverce, můžeme definici přepsat jako '''GC=2A''' nebo také '''GC=1-2B'''. Odtud použitím posledního jmenovaného výrazu dostáváme matematický vztah | ||
- | < | + | <big>\(GC= 1 - 2\int_S F^G(s) dF^B(s),\)</big> |
- | kde < | + | kde <big>\(F^G(s)\)</big> a <big>\(F^B(s)\)</big> jsou distribuční funkce dobrých a špatných klientů (viz [[skóringový model]]). Jiné vyjádření získáme, vyjdeme-li ze vztahu '''GC=2A'''. Potom |
- | < | + | <big>\(GC= 2\int_S \big(F^B(s)-F^G(s)\big) dF^B(s).\)</big> |
== Interpretace == | == Interpretace == | ||
Řádka 23: | Řádka 23: | ||
Pro odhad Giniho koeficientu lze v praxi použít více postupů. Jedním z často používaných je odhad pomocí tzv. ''Somersovy d statistiky''. | Pro odhad Giniho koeficientu lze v praxi použít více postupů. Jedním z často používaných je odhad pomocí tzv. ''Somersovy d statistiky''. | ||
- | Označíme-li < | + | Označíme-li <big>\(s_j\)</big> skóre j-tého klienta, můžeme definovat charakteristiky '''a''', '''b''' a '''c''' následovně: |
- | * '''a''' je počet všech dvojic klientů (i,j), i>j takových, že rozdíly < | + | * '''a''' je počet všech dvojic klientů (i,j), i>j takových, že rozdíly <big>\(s_i-s_j\)</big> a <big>\(y_i-y_j\)</big> jsou nenulové a mají stejné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen větším skóre než špatný klient); |
- | * '''b''' je počet všech dvojic klientů (i,j), i>j takových, že rozdíly < | + | * '''b''' je počet všech dvojic klientů (i,j), i>j takových, že rozdíly <big>\(s_i-s_j\)</big> a <big>\(y_i-y_j\)</big> jsou nenulové a mají opačné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen menším skóre než špatný klient); |
- | * '''c''' je počet všech dvojic klientů (i,j), i>j takových, že < | + | * '''c''' je počet všech dvojic klientů (i,j), i>j takových, že <big>\(s_i=s_j\)</big> a <big>\(y_i\neq y_j\)</big> (tedy takových dvojic, kde dobrý klient byl ohodnocen stejným skóre jako špatný klient). |
Potom ''Somersovu d statistiku'' spočítáme jako | Potom ''Somersovu d statistiku'' spočítáme jako | ||
- | < | + | <big>\(d = \frac{a-b}{a+b+c}.\)</big> |
== Související články == | == Související články == |
Aktuální verze z 14. 8. 2022, 14:51
Giniho koeficient je číselná charakteristika diverzifikace. Má veliké uplatnění v ekonomii, kde se jím poměřuje ekvivalence rozložení bohatství a důchodů v jednotlivých územních celcích, nejčastěji státech. Dále se často používá jako míra diverzifikační schopnosti skóringového modelu. Udává se od 0 do 1.
Obsah |
Definice
Giniho koeficient většinou definujeme jako poměr plochy mezi Lorenzovou křivkou a diagonálou jednotkového čtverce (A) ku celkové ploše pod diagonálou (A+B), tedy
\(GC=\frac{A}{A+B}.\)
Protože obsah plochy pod diagonálou je polovina jednotkového čtverce, můžeme definici přepsat jako GC=2A nebo také GC=1-2B. Odtud použitím posledního jmenovaného výrazu dostáváme matematický vztah
\(GC= 1 - 2\int_S F^G(s) dF^B(s),\)
kde \(F^G(s)\) a \(F^B(s)\) jsou distribuční funkce dobrých a špatných klientů (viz skóringový model). Jiné vyjádření získáme, vyjdeme-li ze vztahu GC=2A. Potom
\(GC= 2\int_S \big(F^B(s)-F^G(s)\big) dF^B(s).\)
Interpretace
Giniho koeficient je tedy dvojnásobek plochy mezi Lorenzovou křivkou a diagonálou jednotkového čtverce, neboli ekvivalentně poměr této plochy a celkové plochy pod diagonálou. Hodnota Giniho koeficientu proto leží v intervalu [0,1], kde hodnota 0 značí perfektní (ideální) diverzifikační schopnost, hodnota 1 značí nulovou diverzifikační schopnost a záporné hodnoty značí opačnou klasifikaci skóringové funkce.
Somersovo d
Pro odhad Giniho koeficientu lze v praxi použít více postupů. Jedním z často používaných je odhad pomocí tzv. Somersovy d statistiky.
Označíme-li \(s_j\) skóre j-tého klienta, můžeme definovat charakteristiky a, b a c následovně:
- a je počet všech dvojic klientů (i,j), i>j takových, že rozdíly \(s_i-s_j\) a \(y_i-y_j\) jsou nenulové a mají stejné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen větším skóre než špatný klient);
- b je počet všech dvojic klientů (i,j), i>j takových, že rozdíly \(s_i-s_j\) a \(y_i-y_j\) jsou nenulové a mají opačné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen menším skóre než špatný klient);
- c je počet všech dvojic klientů (i,j), i>j takových, že \(s_i=s_j\) a \(y_i\neq y_j\) (tedy takových dvojic, kde dobrý klient byl ohodnocen stejným skóre jako špatný klient).
Potom Somersovu d statistiku spočítáme jako
\(d = \frac{a-b}{a+b+c}.\)
Související články
Externí odkazy
Náklady na energie a provoz naší encyklopedie prudce vzrostly. Potřebujeme vaši podporu... Kolik ?? To je na Vás. Náš FIO účet — 2500575897 / 2010 |
---|
Informace o článku.
Článek je převzat z Wikipedie, otevřené encyklopedie, do které přispívají dobrovolníci z celého světa. |