Učinkovitost je asimptotično merilo. Asimptotično optimalna Asimptotska selekcijska merila

Diplomsko delo

Zato je bila ena od poti razvoja testiranja statističnih hipotez pot “empirične” konstrukcije kriterijev, ko konstruirana statistika kriterija temelji na določenem principu, genialni zamisli oz. zdrava pamet, vendar njegova optimalnost ni zagotovljena. Da bi upravičili uporabo takšne statistike pri testiranju hipotez proti določenemu razredu alternativ, najpogosteje z metodo ...

1. Podporne informacije
- 1. 1. Informacije iz teorije C/- in V-statistike
- 1. 2. Definicija in izračun Bahadurjevega izkoristka
- 1. 3. O velikih odstopanjih II- in V-statistike
2. Baringhouse-Hentzejev kriterij simetrije
- 2. 1. Uvod
- 2. 2. Statistika
- 2. 3. Statistika
3. Merila eksponentnosti
- 3. 1. Uvod
- 3. 2. Statistika I
- 3. 3. Statistika št
4. Merila normalnosti
- 4. 1. Uvod
- 4. 2. Statistika B^
- 4. 3. Statistika V^n
- 4. 4. Statistika V|)Str
5. Kriteriji skladnosti s Cauchyjevim zakonom
- 5. 1. Uvod
- 5. 2. Statistika
- 5. 3. Statistika

Asimptotične lastnosti simetrije in kriteriji soglasja na osnovi karakterizacij (esej, naloga, diploma, test)

Ta disertacija konstruira in proučuje merila primernosti in simetrije na podlagi karakterizacijskih lastnosti porazdelitev ter izračuna njihovo asimptotično relativno učinkovitost za številne alternative.

Konstrukcija statističnih kriterijev in proučevanje njihovih asimptotičnih lastnosti je eden najpomembnejših problemov matematične statistike. Pri testiranju preproste hipoteze proti preprosti alternativi se problem reši z uporabo Neyman-Pearsonove leme, ki, kot je znano, daje optimalni (najmočnejši) kriterij v razredu vseh kriterijev določene ravni. To je test razmerja verjetnosti.

Vendar pa za težje in praktične težave pri testiranju hipotez, ki vključujejo testiranje zapletenih hipotez ali upoštevanje zapletenih alternativ, le redko obstajajo enotno najmočnejši testi in vloga testa razmerja verjetnosti se bistveno spremeni. Statistike razmerja verjetnosti običajno ni mogoče eksplicitno izračunati; izgubi svojo lastnost optimalnosti in njena porazdelitev je nestabilna glede na spremembe v statističnem modelu. Poleg tega statistik pogosto sploh ne more določiti vrste alternative, brez česar postane konstrukcija parametričnih kriterijev nesmiselna.

Zato je bil eden od načinov za razvoj testiranja statističnih hipotez pot »empirične« konstrukcije kriterijev, ko konstruirana statistika kriterija temelji na določenem principu, genialni zamisli ali zdravi pameti, vendar njegova optimalnost ni določena. zagotovljeno.

Tipični primeri takšnih statistik so predznačna statistika, Pearsonova x2 statistika (1900), Kolmogorova statistika (1933), ki meri enakomerno razdaljo med empirično in pravo porazdelitveno funkcijo, Kendallov rang korelacijski koeficient (1938) ali Bickel- Rosenblattova statistika (1973), ki temelji na kvadratnem tveganju ocene jedrske gostote. Trenutno ima matematična statistika na desetine "empiričnih" statistik za preizkušanje hipotez skladnosti, simetrije, homogenosti, naključnosti in neodvisnosti, v literaturi pa se nenehno predlaga vedno več statistik te vrste. Ogromna literatura je posvečena preučevanju njihovih natančnih in mejnih porazdelitev, ocenam stopnje konvergence, velikim odstopanjem, asimptotičnim razširitvam itd.

Da bi upravičili uporabo tovrstnih statistik pri testiranju hipotez proti določenemu razredu alternativ, se njihova moč najpogosteje izračuna s statističnim modeliranjem. Vendar pa se za vsako dosledno merilo moč nagiba k enotnosti, ko se velikost vzorca povečuje, in zato ni vedno informativen. Poglobljeno analizo primerjalnih lastnosti statistike je mogoče izvesti na podlagi koncepta asimptotične relativne učinkovitosti (ARE). Različne pristope k izračunu AOE so predlagali E. Pitman, J. Hodges in E. Lehman, R. Bahadur, G. Chernov in W. Kallenberg sredi 20. stoletja, rezultati razvoja teorije AOE do sredine 20. stoletja; V monografiji so strnjena 90. leta. Obstaja splošno sprejeto mnenje, da mora sintezo novih kriterijev spremljati ne le analiza njihovih lastnosti, temveč tudi izračun AOE, da bi ocenili njihovo kakovost in podali informirana priporočila za njihovo uporabo v praksi.

Ta prispevek uporablja idejo konstruiranja meril, ki temeljijo na karakterizaciji porazdelitev z lastnostjo enakomerne porazdelitve. Teorija karakterizacije izvira iz dela D. Polya, objavljenega leta 1923. Nato so jo razvili v delih I. Martsinkevich, S. N. Bernstein, E. Lukach, Yu V. Linnik, A.A. Singer, J. Darmois, V.P. Skitovich, S.R. Pao, A.M. Kagan, J. Galambos, S. Kotz, L. B. Klebanov in številni drugi matematiki. Literatura na to temo je obsežna in trenutno obstaja več monografij, posvečenih karakterizacijam, na primer , , , , , , .

Zamisel o izdelavi statističnih kriterijev na podlagi lastnosti enakomerne porazdelitve pripada Yu V. Linniku. Na koncu svojega obsežnega dela je zapisal: ». lahko postavimo vprašanje konstruiranja meril za ujemanje vzorca s kompleksno hipotezo, ki temelji na identični porazdelitvi dveh ustreznih statistik gi (xi> .xr) in g2(x, ¦¦¦xr) in tako zmanjšamo vprašanje glede merila homogenosti."

Za razlago se vrnimo k klasičnemu izreku Polya konkreten primer kako bi lahko tak pristop deloval. V najpreprostejši obliki je ta izrek formuliran na naslednji način.

Polyin izrek. Naj sta X in Y dva neodvisna in enako porazdeljena središčna s. V. Potem s. V. (X + Y)//2 in X sta enako porazdeljena, če in samo če je zakon porazdelitve X normalen.

Recimo, da imamo vzorec centriranih neodvisnih opazovanj Xi, ., Xn in želimo preizkusiti (kompleksno) ničelno hipotezo, da je porazdelitev tega vzorca normalna s povprečjem 0 in nekaj variance. S pomočjo našega vzorca konstruirajmo običajno empirično porazdelitveno funkcijo (d.f.) n

Fn (t) = n-^VD

Gn(t) = n~2? VD + Xj< iv^}, t <= R1. i, j=l

Na podlagi Glivenko-Cantellijevega izreka, ki velja tudi za V-statistično empirično d.f. , se pri velikih n funkcija Fn(t) enakomerno približuje d.f. F (t) = P (X< t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Vendar pa ta zasnova, ki temelji na ideji Yu V. Linnika, ni prejela skoraj nobenega razvoja, morda zaradi tehničnih težav pri konstruiranju in analizi nastalih meril. Drugi razlog je verjetno ta, da je karakterizacij porazdelitev z lastnostjo enakomerne porazdelitve malo in daleč.

Poznamo le nekaj del, ki so v eni ali drugi meri posvečena razvoju ideje Yu V. Linnika. To so dela Baringhousea in Henzeja ter Muliera in Nikitina, o katerih bo govora v nadaljevanju. Obstajajo tudi dela, v katerih so kriteriji primernosti za specifične porazdelitve konstruirani tudi na podlagi karakterizacij, ne pa na podlagi enakomerne porazdelitve, na primer , , , , , , , .

Najpogostejša uporaba v literaturi je karakterizacija eksponentne porazdelitve z uporabo različnih variant lastnosti brez spomina , , , , , , .

Opozoriti je treba, da v skoraj vseh teh delih (razen morda) AOE obravnavanih kriterijev ni izračunan ali obravnavan. V tem diplomskem delu ne preučujemo le asimptotičnih lastnosti znanih in naših predlaganih kriterijev, ki temeljijo na karakterizaciji, temveč tudi izračunamo njihov lokalni natančen (ali približen) AOE po Bahadurju.

Opredelimo zdaj koncept AOE. Naj sta (Tn) in (1^) dve zaporedji statistik, sestavljeni iz vzorca X,., Xn s porazdelitvijo Pd, kjer je v € 0 C R1, ničelna hipoteza Ho pa je testirana: 9 € v C proti alternativi A: v € ©-x = ©-6o. Naj bo Mm (a, P,0) najmanjša velikost vzorca X[,., Xn, za katero zaporedje (Tn) z dano stopnjo pomembnosti a > 0 doseže moč /3< 1 при alternativni pomen parameter v € (c)1- Podobno uveden v). Relativna učinkovitost merila, ki temelji na statistiki Tn, glede na merilo, ki temelji na Vn, je vrednost, ki je enaka obratnemu razmerju navedenih volumnov vzorca:

Ker relativne učinkovitosti kot funkcije treh argumentov ni mogoče eksplicitno izračunati niti za najpreprostejše statistike, je običajno upoštevati meje:

Ptet, y (a,/?, 0), Ntet, y (a,/3,0).

V prvem primeru dobimo AOE po Bahadurju, druga meja določa AOE po Hodges-Lehmanu, tretja pa vodi do določitve AOE po Pitmanu. Ker so v praktičnih aplikacijah najbolj zanimivi primeri nizkih stopenj pomembnosti, visokih moči in bližnjih alternativ, se zdijo vse tri definicije razumne in naravne.

V tem delu bomo za primerjavo kriterijev uporabili AOE po Bahadurju. Razlogov za to je več. Prvič, Pitmanova učinkovitost je primerna predvsem za asimptotično normalno statistiko in pod tem pogojem sovpada z lokalno Bach-Durjevo učinkovitostjo , . Upoštevamo ne samo asimptotično normalno statistiko, temveč tudi statistiko kvadratnega tipa, za katero se mejna porazdelitev pod ničelno hipotezo močno razlikuje od normalne, tako da Pitmanova učinkovitost ni uporabna. Drugič, Hodges-Lehmanov AOE ni primeren za preučevanje dvostranskih kriterijev, saj se vsi izkažejo za asimptotično optimalne, pri enostranskih kriterijih pa ta AOE običajno lokalno sovpada z Bahadurjevim AOE. Tretjič, pomemben napredek je bil nedavno dosežen na področju velikih odstopanj za testno statistiko, kar je ključnega pomena pri izračunu Bahadur AOE. Sklicujemo se na velika odstopanja U- in V-statistik, opisanih v zadnjih delih in.

Preidimo zdaj na pregled vsebine disertacije. Prvo poglavje je pomožne narave. Določa potrebne teoretične in tehnične informacije iz teorije 11-statistike, teorije velikih odklonov in teorije asimptotične učinkovitosti po Bahadurju.

Poglavje 2 je posvečeno konstrukciji in preučevanju kriterijev za testiranje hipoteze o simetriji. Baringhouse in Henze sta predlagala idejo o izdelavi meril simetrije na podlagi naslednje osnovne karakterizacije.

Naj sta X in Y n.o.s.v., ki imata zvezno d.f. Nato |X| in |max (X, Y)| enako porazdeljena, če in samo če sta X in Y simetrično porazdeljena okoli ničle.

To karakterizacijo uporabljamo za izdelavo novih kriterijev simetrije. Spomnimo se, da več klasičnih kriterijev simetrije (glej 4. poglavje) temelji na karakterizaciji simetrije s še enostavnejšo lastnostjo enakomerne porazdelitve X in -X.

Vrnimo se k Baringhouse-Hentzejevi karakterizaciji. Naj bodo X, ., Xn opazovanja z zvezno d.f.<7. Рассмотрим проверку гипотезы симметрии:

H0: OD = 1 —<3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в >0-poševna alternativa, tj. d(x-b) = 2f(x)F ($x), c > 0-Lemanova alternativa, tj. G(x-, 6) = F1+ e (x), 6 > 0 in alternativa onesnaževanja , tj. G(x-6) = (1 - 6) F(x) + 6Fr+1(x), in > 0, r > 0, kjer sta F (x) in f (x) d.f. in gostoto neke simetrične porazdelitve.

V skladu z zgornjo karakterizacijo je empirična df konstruirana na podlagi |Xj|,., Xn, n

Hn (t) = n~2 J2 Tmax (X^Xk)<г}. На основе этих функций составляются статистики: лоо ):

Naj bo X uY nenegativen in nedegeneriran n.o.s.v., ki ima d.f. F in naj bo 0< а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Poleg konstruiranja samega kriterija soglasja in proučevanja njegovih asimptotičnih lastnosti je zanimivo izračunati AOE novega kriterija in proučiti njegovo odvisnost od parametra a.

Druga posplošitev te karakterizacije pripada Desu. Oblikujemo ga na podlagi novejšega dela:

Naj bodo Xi, ., Xm, m ^ 2 nenegativni in nedegenerirani i.s. r.v.s, ki ima diferencialno d.f. F. Potem sta statistiki X in m minpfi, ., Xm) enako porazdeljeni, če in samo če je F d.f. eksponentni zakon.

Naj bodo Xx,., Xn neodvisna opazovanja z d.f. Na podlagi zgoraj formuliranih karakterizacij lahko preizkusimo eksponentno hipotezo Ho, ki je sestavljena iz dejstva, da je (7 d.f. eksponentnega zakona. P, proti alternativi H, ki je sestavljena iz dejstva, da C f? pod šibkim dodatnim pogoji.

V skladu s temi karakterizacijami je izdelan empirični df. p = pVD< О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Predlagamo, da merilo za preverjanje eksponentnosti temelji na statistiki: pkp = - c&bdquo-(*)] aop(1).

Kot alternative izberemo standardne alternative, ki se uporabljajo v literaturi o eksponentnem testiranju: Weibullova alternativa z d(x) = (β + 1)xx(-x1+β), x ^ 0- alternativa Makehama z d(x) = ( 1 + 0(1 - exp (-x))) exp (-x - 0(exp (-x) - 1 + x)), x ^ 0 - alternativa linearnosti funkcije stopnje napak z d (x) = (1 + bx) exp[—x—^bx2], x^O.

Za dve zgoraj predlagani statistiki so mejne porazdelitve pod ničelno hipotezo zapisane:

Izrek 3.2.1 Za statistiko Uε za n -* oo velja zveza: kjer je Dz(a) definiran v (3.2.2). Izrek 3.3.1 Za statistiko n pri n -> oo razmerje velja

U0,(t + 1)2A1(t)), kjer je D4 (t) definiran v (3.3.6).

Ker sta obe statistiki odvisni od parametrov a in m, ugotovimo, pri katerih vrednostih parametrov AOE po Bahadurju doseže svoj maksimum in poiščemo te vrednosti. Poleg tega konstruiramo alternativo, v kateri je maksimum dosežen v točki in φ ½.

Četrto poglavje je namenjeno preverjanju hipoteze o normalnosti. Obstaja veliko karakterizacij normalnega zakona kot enega osrednjih zakonov teorije verjetnosti in matematične statistike, dve monografiji pa sta posvečeni izključno temu vprašanju. Upoštevali bomo nekoliko poenostavljeno različico dobro znane karakterizacije in:

Naj bodo Xr, X2, ., Xm centrirani n.o.s.v.s z d.f. o konstante a, a-2,., am so takšne, da je 0< а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Naj bo X, ., Xn vzorec z d.f. G. Na podlagi te karakterizacije lahko preizkusimo glavno hipotezo R0, ki pravi, da je G d.f. normalni zakon Fa (x) = Ф (x/a), proti alternativi Hi, ki je G φ Fa. Izdelana je običajna empirična df. Gn in V-statistični d.f. n^

Bm, n (t) = n~t (E 1 + - +< *}),

1.¿-t=1 s

V nadaljevanju simbol a pomeni seštevek vseh permutacij indeksov. Merila za testiranje normalnosti lahko temeljijo na naslednjih statističnih podatkih:

B, n = Г dGn (t), J -00 oo

BmAt)-Gn (t)]dGn (t), oo

Koš = G avtor Kremlev Sergej

Optimalna možnost Analiza možnih scenarijev razvoja dogodkov neizogibno povzroči razmišljanje o izbiri optimalne možnosti. Ni mogoče reči, da različne "poletne" možnosti, torej alternative, vezane na maj-junij - julij 1941, vzbujajo optimizem. Ne, oni

Najboljša možnost

Iz knjige Velika domoljubna alternativa avtor Isaev Aleksej Valerievič

Optimalen nadzor

Iz knjige Samopodoba pri otrocih in mladostnikih. Knjiga za starše avtor Eyestad Gyru

Optimalen nadzor Kaj pomeni zmerno tesno držati? To morate določiti sami, glede na poznavanje lastnega otroka in pogojev okolja, v katerem živite. V večini primerov starši najstnikov poskušajo svoje otroke zaščititi pred kajenjem, pitjem alkohola,

Optimalen način

Iz knjige Paradoks perfekcionista avtorja Ben-Shahar Tal

Optimalna pot Nenehno smo bombardirani s popolnostjo. Adonis krasi naslovnico Men's Health, Elena the Beautiful krasi naslovnico Voguea; ženske in moški na širokem platnu v uri ali dveh rešijo svoje konflikte, odigrajo idealen zaplet, se predajo idealni ljubezni. Vsi smo slišali

Optimalen pristop

Iz knjige Strokovnjak št. 07 (2013) avtorska revija Strokovnjak

Optimalen pristop Sergej Kostjajev, kandidat politologije, višji raziskovalec pri INION RAS Ministrstvo za obrambo ZDA je porabilo milijardo dolarjev za nedelujoči računalniški program Foto: EPA S 1. marcem se bo poraba Pentagona verjetno zmanjšala za 43 milijard

Najboljša možnost

Iz knjige Dva letna časa avtor Arsenjev L

Optimalna možnost - Povejte mi, ali je pametno igrati na več frontah hkrati? - novinarji so na samem začetku sezone '75 vprašali Bazileviča in Lobanovskega: "Seveda je nerazumno," sta odgovorila. - Vendar je potrebno. Menimo, da je nujno treba razlikovati pomen

Optimalen nadzor

Iz knjige Upravljanje osebnih (družinskih) financ. Sistemski pristop avtor Steinbock Mihail

Optimalen nadzor >> Pri optimalnem nadzoru delimo vse izdatke v dve veliki skupini: – »navadni« – redni izdatki, – Optimalni nadzor lahko uporabimo šele po večmesečni podrobni kontroli.