In der Wahrscheinlichkeitstheorie sind schwere Verteilungen Wahrscheinlichkeitsverteilungen, deren Schwänze nicht exponentiell begrenzt sind: [1] dh sie haben schwerwiegendere Schwänze als die exponentielle Verteilung. In vielen Anwendungen ist der rechte Schwanz der Verteilung von Interesse, aber eine Verteilung kann einen schweren linken Schwanz haben, oder beide Schwänze können schwer sein.
Es gibt drei wichtige Unterklassen von Verteilungen mit schwerem Schwanz: die Verteilungen mit dickem Schwanz, die Verteilungen mit langem Schwanz und die subexponentialen Verteilungen . In der Praxis gehören alle häufig verwendeten Verteilungen mit schwerem Schwanz zur subexponentialen Klasse.
Es gibt immer noch einige Diskrepanzen in Bezug auf die Verwendung des Begriffs mit schweren Schwänzen . Es gibt zwei weitere Definitionen. Einige Autoren verwenden den Begriff, um sich auf solche Verteilungen zu beziehen, für die nicht alle ihre Kraftmomente endlich sind. und einige andere zu den Verteilungen, die keine endliche Varianz haben. Die in diesem Artikel enthaltene Definition ist die am häufigsten verwendete und umfasst alle von den alternativen Definitionen umfassten Verteilungen sowie solche Verteilungen wie log-normal, die alle ihre Kraftmomente besitzen, die jedoch im Allgemeinen als schwermütig gelten . (Gelegentlich wird Heavy-Tailed für alle Distributionen verwendet, die schwerer als die Normalverteilung sind.)
Definitionen [ edit ]
Definition der Verteilung mit schwerem Schwanz [ edit
Die Verteilung einer Zufallsvariablen X mit Verteilungsfunktion F soll einen schweren (rechten) Schwanz haben, wenn die Moment erzeugende Funktion von X M X t ), ist für alle unendlich t > 0. [2]
Dies wird auch in Bezug auf die Heckverteilungsfunktion geschrieben
als
Definition der Long-Tailed-Distribution [19659006] [ edit ]
Die Verteilung einer Zufallsvariablen X mit Verteilungsfunktion F soll einen langen rechten Schwanz [1] haben, wenn für alle t > 0,
oder gleichwertig
Dies hat die intuitive Interpretation für eine rechtwinklige verteilte Menge mit langen Enden. Wenn die lange Menge einen hohen Pegel überschreitet, nähert sich die Wahrscheinlichkeit 1, dass ein anderer höherer Pegel überschritten wird.
Alle Long-Tailed-Distributionen sind Heavy-Tailed, aber das Gegenteil ist falsch und es ist möglich, Heavy-Tail-Distributionen zu konstruieren, die nicht Long-Tailed sind.
Subexponentielle Verteilungen [ edit ]
Subexponentialität wird in Form von Windungen von Wahrscheinlichkeitsverteilungen definiert. Für zwei unabhängige, gleichverteilte Zufallsvariablen mit gemeinsamer Verteilungsfunktion die Faltung von F "/> ist ein Faltungsquadrat, wobei verwendet wird –Stieltjes-Integration durch:
Die n -fache Faltung ist auf dieselbe Weise definiert. Die Schwanzverteilungsfunktion ist definiert als .
Eine Verteilung auf der positiven Halblinie ist subexponential [1][5][6] if
Pr X 1 + [1945 + X n > x ] [1965943] max ( X 1 … X n ] ] x ] x ] x ] ] als x → [1945 . { displaystyle Pr [X_{1}+cdots +X_{n}>x] sim Pr [max(X_{1},ldots ,X_{n})>x] quad { text {as} } x an infty.}
Dies wird häufig als Prinzip des einzigen großen Sprungs [8] oder Katastrophenprinzips bezeichnet. [9]
Alle subexponentiellen Verteilungen sind long-tailed, aber Beispiele können aus long-tailed-Verteilungen aufgebaut werden, die nicht subexponentiell sind.
Häufige Schwermetalldistributionen [ edit ]
Alle üblicherweise verwendeten Schwermetalldistributionen sind subexponential. [7]
Diejenigen, die eine sind. angebunden sind:
Zu denjenigen, die zweiseitig sind, gehören:
Beziehung zu Fat-tailed-Verteilungen [ edit ]
Eine Fat-tailed-Verteilung ist eine Verteilung, für die die Wahrscheinlichkeitsdichtefunktion für ein großes x als Potenz [gegen Null geht]. 19659399] x - a { displaystyle x ^ {- a}} . Da eine solche Potenz immer von der Wahrscheinlichkeitsdichtefunktion einer Exponentialverteilung begrenzt wird, sind Fettverteilungen immer stark ausgeprägt. Einige Distributionen haben jedoch einen Schwanz, der langsamer auf Null geht als eine Exponentialfunktion (was bedeutet, dass sie einen schweren Schwanz haben), aber schneller als eine Potenz (was bedeutet, dass sie keinen Fettschwanz sind). Ein Beispiel ist die Protokollnormalverteilung von . Viele andere Großverteilungen wie die Logistiklogistik und die Pareto-Verteilung sind jedoch ebenfalls fett.
Es gibt parametrische (siehe Embrechts et al. [7]) und nichtparametrische (siehe z. B. Novak [15]) Ansätze für das Problem der Tail-Index-Schätzung.
Um den Tail-Index mithilfe des parametrischen Ansatzes zu schätzen, verwenden einige Autoren die GEV-Verteilung oder die Pareto-Verteilung. Sie können den Maximum-Likelihood-Schätzer (MLE) anwenden.
Pickands Schätzung des Schwanzindex [ edit ]
Mit ( X n n n n ] 1 ) { displaystyle (X_ {n}, n geq 1)} eine zufällige Folge einer unabhängigen und gleichen Dichtefunktion F D ( H () ] (19659202]) (19659202]) in D (H ( xi))} der Maximum Attraction Domain [16] der generalisierten Extremwertdichte H { displaystyle H} wobei 19 R { displaystyle xi in mathbb {R}} . Wenn lim n → 19 k n n = [19659026][1945 { displaystyle lim _ {n bis infty} k (n) = infty} lim n → ∞ k n ] ]. n = 0 { displaystyle lim_ {n bis infty} { frac {k (n)} {n}} = 0} dann ist der Pickands Tail-Index-Schätzwert [7][16]
( k [19659022] ( n ) n ) Pickands = 1 In 19 ( X ( n - k + 1 [19659118] n ) - X ( n - 2 2 k 19659023] n ) + 1 n ) X ( n 2 k ( n ) + 1 n ) - X ( n - 4 k ( n ) + 1 19659023] ]) ) { displaystyle xi _ {(k (n), n)} ^ { text {Pickands}} = { frac {1} { ln 2}} ln left ({ frac {X _ {(nk (n) + 1, n)} - X _ {(n-2k (n) + 1, n)} {X _ {(n-2k (n) + 1, n) } -X _ {(n-4k (n) + 1, n)}} right)}
wobei X [19659492] ( n - k ( n ) + 1 n ] max max max X n - k ( n ) + 1 ... [19456510] ... [19456510] X n ) { displaystyle X _ {(nk (n) + 1, n)} = max left (X_ {nk (n) +1}) ldots, X_ {n} right)} . Dieser Schätzer konvergiert mit Wahrscheinlichkeit { displaystyle xi} .
( k ( n ) [19659023] n ) Hill = ( 1 k ( n ) i = n - k ( n ) + 1 n ln ln [1945 ( X ( i n ) ) - ln [1945 ( X ( n - k ( n + + 1 n ) ) ) - 1 {19659256] (19659256) {k (n. N) ), n)} ^ { text {Hill}} = left ({ frac {1} {k (n)}} sum _ {i = nk (n) +1} ^ {n} ln ( X _ {(i, n)}) - ln (X _ {(nk (n) + 1, n)}) right) ^ {- 1},}
wobei [1 9659752] X ( i n ] {{displaystyle X _ {(i, n)}} ist die i { displaystyle i} -te -Ordnungsstatistik von X 1 . … X n { displaystyle X_ {1}, dots, X_ {n}} . Dieser Schätzer konvergiert mit Wahrscheinlichkeit ] { displaystyle xi} und ist asymptotisch normal ]) → [1945 { displaystyle k (n) to infty} ist eingeschränkt auf einer regulären Variationseigenschaft höherer Ordnung. [18] . [19] Konsistenz und asymptotische Normalität erstrecken sich auf eine große Klasse von abhängigen und heterogenen Sequenzen, [20][21] unabhängig davon, ob X t { displaystyle X_ {t}} wird beobachtet oder berechnete verbleibende oder gefilterte Daten aus einer großen Klasse von Modellen und Schätzern, einschließlich falsch spezifizierter Modelle und Modelle mit abhängigen Fehlern. [19659796Ratio-SchätzerdesTail-Index [ edit ]
Der Ratio-Schätzer (RE-Estimator) des Tail-Index wurde von Goldie eingeführt und Smith. [25] Sie ist ähnlich wie Hill's Schätzer aufgebaut, verwendet jedoch einen nicht zufälligen "Abstimmungsparameter".
Ein Vergleich von Hill-Typ- und RE-Typ-Schätzern ist in Novak zu finden. [15]
Software [ edit ]
ä, C-Werkzeug zum Schätzen des Heavy-Tail-Index [26]
Schätzung der Dichte der schweren Schwänze [ edit ]
Es wurden nichtparametrische Ansätze zur Abschätzung der Dichte- und Schwerewahrscheinlichkeitsdichtefunktionen angegeben Markovich. [27] Dies sind Ansätze, die auf variablen Bandbreiten- und Long-Tail-Kernel-Schätzern basieren. bei der vorläufigen Datentransformation in eine neue Zufallsvariable in endlichen oder unendlichen Intervallen, was für die Schätzung zweckmäßiger ist, und dann die inverse Transformation der erhaltenen Dichteschätzung; und "Zusammenfügen" -Ansatz, der ein bestimmtes parametrisches Modell für das Ende der Dichte und ein nicht-parametrisches Modell zur Verfügung stellt, um den Modus der Dichte anzunähern. Nichtparametrische Schätzer erfordern eine geeignete Auswahl von Abstimmungsparametern (Glättung), wie z. B. die Bandbreite von Kernel-Schätzern und die Bin-Breite des Histogramms. Die bekannten datengetriebenen Methoden für eine solche Auswahl sind eine Kreuzvalidierung und ihre Modifikationen, Methoden, die auf der Minimierung des mittleren quadratischen Fehlers (MSE) und seiner asymptotischen und oberen Grenzen basieren. [28] Eine Diskrepanzmethode, die gut verwendet. Bekannte nichtparametrische Statistiken wie die von Kolmogorov-Smirnov, von Mises und Anderson-Darling als Metrik im Bereich der Verteilungsfunktionen (dfs) und Quantile der späteren Statistiken als bekannte Unsicherheit oder Diskrepanzwert finden sich in Bootstrap. [27] Bootstrap ist ein weiteres Werkzeug zum Finden von Glättungsparametern unter Verwendung von Annäherungen an unbekannte MSE durch verschiedene Schemata der Neuabtastungsauswahl, siehe z. B. [29]
. Siehe auch [ edit
] ]
^ a b 19659818] Asmussen, SR (2003). "Steady-State-Eigenschaften von GI / G / 1". Angewandte Wahrscheinlichkeit und Warteschlangen . Stochastische Modellierung und Angewandte Wahrscheinlichkeit. 51 . S. 266–301. doi: 10.1007 / 0-387-21525-5_10. ISBN 978-0-387-00211-8.
^ Rolski, Schmidli, Scmidt, Teugels, Stochastische Prozesse für Versicherungen und Finanzen 1999
S. Foss , D. Korshunov, S. Zachary, Eine Einführung in hochschwanzige und subexponentielle Verteilungen Springer Science & Business Media, 21. Mai 2013
^ Rolski, Schmidli, Scmidt, Teugels, Stochastische Prozesse für Versicherungen und Finanzen 1999
^ V. P. Chutyakov, ein Theorem über Summen unabhängiger positiver Zufallsvariablen und ihrer Anwendungen zum Verzweigen von Zufallsprozessen, der Nachdenklichen-Theorie und der Anwendungen. Teugels, Die Klasse der subexponentiellen Verteilungen, Annalen der Wahrscheinlichkeit 1975 http://projecteuclid.org/download/pdf_1/euclid.aop/1176996225
a b c d Embrechts P .; Klueppelberg C .; Mikosch T. (1997). Modellierung extremer Ereignisse für Versicherungen und Finanzen . Stochastische Modellierung und Angewandte Wahrscheinlichkeit. 33 . Berlin: Springer. doi: 10.1007 / 978-3-642-33483-2. ISBN 978-3-642-08242-9.
^ Foss, S .; Konstantopoulos, T .; Zachary, S. (2007). "Diskrete und kontinuierliche zeitmodulierte Random Walks mit Inkrementen mit starkem Schwanz" (PDF) . Journal of Theoretical Probability . 20 (3): 581. arXiv: math / 0509605 . CiteSeerX 10.1.1.210.1699 . doi: 10.1007 / s10959-007-0081-2.
^ Wierman, Adam (9. Januar 2014). "Katastrophen, Verschwörungen und subexponentielle Verteilungen (Teil III)". Rigor + Relevanz-Blog . RSRG, Caltech . 9. Januar 2014 .
^ Willekens, E. (1986). Msgstr "Subexponentialität auf der realen Linie". Technischer Bericht . K.U. Leuven
^ Falk, M., Hüsler, J. & Reiss, R. (2010). Gesetze der kleinen Zahl: Extreme und seltene Ereignisse . Springer p. 80. ISBN 978-3-0348-0008-2. CS1-Wartung: Mehrere Namen: Autorenliste (Link)
^ Alves, MIF, de Haan, L. & Neves, C (10. März 2006). "Statistische Inferenz für Verteilungen mit schweren und superschweren Rändern" (PDF) . CS1: Mehrere Namen: Autorenliste (Link)
John P. Nolan (2009). "Stabile Verteilungen: Modelle für Daten mit starkem Schwanz" (PDF) . 2009-02-21 .
^ Stephen Lihn (2009). "Skew Lognormal Cascade Distribution"
^ a b Novak S.Y. (2011). Extremwertmethoden mit Finanzierungsanträgen . London: CRC. ISBN 978-1-43983-574-6.
^ a b Pickands III, James (Jan 1975). Msgstr "Statistische Inferenz mit extremen Ordnungsstatistiken". Die Annalen der Statistik . 3 (1): 119–131. doi: 10.1214 / aos / 1176343003. JSTOR 2958083.
^ Hill B.M. (1975) Eine einfache allgemeine Herangehensweise an den Schluss einer Verteilung. Ann. Stat., V. 3, 1163–1174.
^ Hall, P. (1982) Nach einigen Schätzungen eines Exponenten der regulären Variation. J. R. Stat. Soc. Ser. B., v. 44, 37–42.
^ Haeusler, E. und J. L. Teugels (1985) Zur asymptotischen Normalität von Hills Schätzer für den Exponenten der regulären Variation. Ann. Stat., V. 13, 743–756.
^ Hsing, T. (1991) Zur Abschätzung des Schwanzindex unter Verwendung abhängiger Daten. Ann. Stat., V. 19, 1547–1569.
^ Hill, J. (2010) Zur Abschätzung des Tail-Index für abhängige, heterogene Daten. Econometric Th., V. 26, 1398–1436.
Resnick, S. und Starica, C. (1997). Asymptotisches Verhalten von Hills Schätzer für autoregressive Daten. Comm. Statist. Stochastic Models 13, 703–721.
Ling, S. und Peng, L. (2004). Hill-Schätzer für den Tail-Index eines ARMA-Modells. J. Statist. Plann. Inference 123, 279–293.
^ Hill, J. B. (2015). Tail-Index-Schätzung für eine gefilterte abhängige Zeitreihe. Stat. Sünde. 25, 609–630.
^ Goldie C. M., Smith R. L. (1987), langsame Variation mit Rest: Theorie und Anwendungen. Quart. J. Math. Oxford, Vers 38, 45–71.
^ Crovella, M. E .; Taqqu, M. S. (1999). Msgstr "Den Heavy - Tail - Index aus Skalierungseigenschaften schätzen". Methodik und Berechnung in angewandter Wahrscheinlichkeit . 1 : 55–79. doi: 10.1023 / A: 1010012224103.
^ a b Markovich N. M. (2007). Nichtparametrische Analyse univariater Daten mit schwerem Schwanz: Forschung und Praxis . Chitester: Wiley. ISBN 978-0-470-72359-3.
^ Wand M. P., Jones M.C. (1995). Kernglättung . New York: Chapman und Hall. ISBN 978-0412552700.
^ Halle P. (1992). Die Expansion von Bootstrap und Edgeworth . Springer ISBN 9780387945088.
Không có nhận xét nào:
Đăng nhận xét