Teoria losowych wartości ekstremalnych

Niniejszy artykuł jest  dodatkiem A do podręcznika Imperfekcyjna metoda projektowania konstrukcji

Cykl artykułów jest w trakcie edycji i będzie publikowany  odcinkami,począwszy od 2 kwietnia 2019 w cyklach tygodniowych

Publikacja internetowa w wersji „free” z nieograniczonym prawem cytatu – z powołaniem się na autora i źródło:
Leszek Chodor, (2019), Imperfekcyjna metoda  projektowania konstrukcji, Encyklopedia  πWiki,
[ http://chodor-projekt.net/encyclopedia/imperfekcyjna-metoda-projektowania-konstrukcji/ ]

Historia edycji:
(start 2019-04-02)   1 rozdział : Imperfekcyjna metoda projektowania konstrukcji  – Wersja 1.0 (2019-04-07) ZAKOŃCZONE 
(2019-04-08)   2 rozdział: Imperfekcje i geneza metod imperfekcyjnychWersja 1.0 (2019-04-15) ZAKOŃCZONE
(2019-04-12)  Dodatek A : Teoria losowych wartości ekstremalnych – –Wersja 1.0  2019-04-18) ZAKOŃCZONE
(2019-04-19)   3 rozdział: Imperfekcje w postanowieniach normowych    (2019-04-15) W TRAKCIE

Proszę społeczność Inżynierów w internecie o przesyłanie recenzji podręcznika  na adres  wydawnictwa biuro@chodor-projekt.net
Leszek Chodor


Omówiono teorię losowych wartości ektremalnych, w tym rozkładu Gumbela i Weibulla w zakresie potrzebnym do zrozumienia wywodów prezentowanych w podręczniku Imperfekcyjna metoda projektowania konstrukcji.

Teoria losowych wartości ekstremalnych

Rys inżynierski teorii

Teoria wartości ekstremalnych lub analiza wartości skrajnych (ang EVA) jest gałęzią statystyk dotyczących skrajnych odchyleń od mediany z rozkładów prawdopodobieństwa. Chodzi o ocenę prawdopodobieństwa zdarzenia, polegającego na tym, że w zbiorze realizacji zmiennej losowej, znajdą się bardziej ekstremalne niż obserwowano wcześniej. Analiza EVA jest szeroko stosowana w wielu dziedzinach inżynierii: hydrologii do oszacowania prawdopodobieństwa wystąpienia niezwykle dużej powodzi lub obciążenia nabrzeży, inżynierii budowlanej w analizie obciążeń budowli wiatrem i śniegiem (Żurański, Gaczek, 2011) [150], (Żurański, Sobolewski, 2009) [151], oraz wytrzymałości elementów i ich systemów (Murzewski, 1989) [79] , a także procesów korozji (Kapur, Lamberson, 1977) [86] i in.  W tych przypadkach interesuje nas probabilistyczny rozkład maksimów obciążeń i minimum wytrzymałości w procesie losowym parametryzowanym czasem albo rzędną przestrzeni.

Rozkłady ekstremalne są właściwe do opisu zdarzeń „ekstremalnych” lub „rzadkich”, to znaczy takich, które są „nadzwyczaj nieprawdopodobne”, generujących zestawy wartości o ekstremalnych odchyleniach od mediany. Opisywanie tymi rozkładami imperfekcji geometrycznych jest odpowiednie do ich natury. Pomiary imperfekcji geometrycznych nie wykazują bowiem systematyczności, ani też podobieństwa do deterministycznie najniekorzystniejszych kształtów, czyli takich, które są podobne do postaci wyboczenia sprężystego. W niniejszym  podręczniku w ciągu wariacyjnym są przedstawione imperfekcje geometryczne konstrukcji zarówno systemowe jak i łukowe i ich kombinacje.

Rozkład prawdopodobieństwa statystyki porządkowej

Realizację $\underline x =[ x_a, \, … \, x_n ]$ losowego wektora $X=[X_1 \, , … \, X_n]$ można przedstawić w postaci uporządkowanego ciągu od wartości najmniejszej do największej:

$$\begin{equation} x_{(1)} \le x_{(2)} \le … \le x_{(n)}  \label {A.0} \end{equation}$$

tak, że $x{(1)}= \min{(x_1 , \, … \, , x_k.\, …\, x_n)}$ oraz  $x{(n)}= \max{(x_1 , \, … \, , x_k.\, …\, x_n)}$.

Po dokonaniu wyboru z określa się nowy ciąg zmiennych losowych, stanowiący rosnący ciąg, nazywany statystyką porządkową lub ciągiem wariacyjnym z próby X:

$$\begin{equation} X_{(1)} \le … \le X_{(k)} \le … \le X_{(n)}  \label {A.1} \end{equation}$$

Zmienna $X_{(k)}$  jest k-tą statystyką porządkową, a a $X_{(1)}$ i  $X_{(n)}$  ekstremalnymi statystykami, odpowiednio najmniejszą i największą. Ważną charakterystyką ciągu wariacyjnego $X$ jest jego mediana, (czyli wartość środkowa), która jest równa $X_{(k+1)}$ dla nieparzystego i $(X_{(k)}+X_{(k+1)})/2$ dla n parzystego.

W niniejszej pracy przyjmujemy, że w ciągu wariacyjnym są przedstawione systemowe imperfekcje geometryczne konstrukcji. Zdarzenie $\{ X_{(k)} \le x \}$ oznacza, że nie mniej niż k-realizacji próby $X$  przyjmuje wartości nie większe od  nielosowego parametru $x$ .  Dystrybuanta $F_{(k)}$ k-tej statystyki porządkowej jest funkcją rozkładu dwumianowego (Ivčenko, Medvedev, 2015) [74], (Cox, Hinkley, 2000) [51]:

$$\begin{equation} F_k (x)= Pr \{ X_{(k)} \le x \} = \sum \limits_{r=k}^n  { {n} \choose {k} } \cdot F^r (x) \left [ 1-F(x) \right ] ^{n-r} \label {A.2} \end{equation}$$

gdzie symbol Newtona $ {n} \choose {k}$ ,  r- liczba rzeczywista.

Z ($\ref{A.2}$) otrzymujemy rozkład statystyk ekstremalnych: (1)-pierwszej, czyli minimów, i (n) – ostatniej, czyli maksimów:

$$\begin{equation} F_{(1)} (x)= Pr \{X_{(1)} \le x \} =1 \left [ 1- F(x) \right ]^n  \label {A.3} \end{equation}$$

$$\begin{equation} F_{(n)} (x)= Pr \{X_{(n)} \le x \} =F^n (x)  \label {A.4} \end{equation}$$

Funkcja gęstości statystyki porządkowej , uzyskana przez różniczkowanie dystrybuanty wynosi

$$\begin{equation} f_k (x) = \cfrac{ \partial F_k (x)} {\partial x}= \cfrac{n!}{(k-1)! (n-k)!} F^{(k-1)} (x) \left [ 1-F(x) \right ]^{n-k} f_X (x)  \label {A.5} \end{equation}$$

Dla dużej liczebności próby asymptotycznie dążącej do $n \to \infty$  liczba statystyk porządkowych również rośnie, a problem rozdziela się na dwa zadania: asymptotyka „średnich” elementów ciągu wariacyjnego oraz analiza wartości skrajnych (EVA). Za „średnią” ciągu wariacyjnego próby o objętości $n$ przy $n \to \infty$  uważa się statystykę $X_{(k)}$ numer której $k=k(n)$ spełnia warunek $\tfrac {k}{n} \to p$ dla $0

Ustalmy wartość  $p$  i rozpatrzmy statystykę porządkową rzędu  $k=[np]$. Można udowodnić (Ivčenko, Medvedev, 2015) [74], że jeśli w otoczeniu punktu $x_p$ gęstość rozkładu prawdopodobieństwa $f_X(x)$ i jego pochodna są ciągłe i $f_{X(x_p)} >0 $, to przy $n \to \infty $,  rozkład statystyki porządkowej rzędu $[np]$ dąży do normalnego

$\Lambda (X_{[np]} \sim N(x_P, \tfrac{pg} {n f_X^2 (x_p) }$.

Wynika stąd, że kwantyl p-tego rzędu oznaczony na próbie $X$ jest asymptotycznie nieobciążonym i efektywnym estymatorem kwantyla rozkładu teoretycznego. Oznacza to również, że „średnie” człony ciągu wariacyjnego przy dużej liczebności próby z dostatecznie gładkich rozkładów są asymptotycznie normalne. Niestety statystyki wartości skrajnych mają inne własności.

Dla skrajnych statystyk porządkowych słuszne jest twierdzenie: W próbie z absolutnie ciągłego rozkładu: statystyki $x_{(r)}$ (statystka początkowa – „mała”) i  $X_{n-s+1)}$ (statystka końcowa – „duża”) dla dowolnych ustalonych $r, \, s \ge 1$ $n \to \infty $  są asymptotycznie niezależne i zachodzi:

$$\begin{equation} \Lambda \left [ nF (X_{(r)} ) \right ] \to \Gamma (1,r) \label {A.6} \end{equation}$$

$$\begin{equation} \Lambda \left [ n \left (1-F (X_{(n-s+1)}  \right) \right ] \to \Gamma (1,s) \label {A.7} \end{equation}$$

gdzie $\Gamma(a,b) jest rozkładem gamma o parametrach $a$ i $b$.
Standardowe programy numeryczne (np. Matlab  (Mathworks, 2017) [P11] i  Mathematica (Wolfram, MathWorld, 2019) [P10]) są wyposażone w stosowne procedury do obliczeń gamma – funkcji oraz innych funkcvji specjalnych, występujących w niniejszym artykule.

Zwróćmy uwagę, że asymptotyczne rozkłady wartości skrajnych nie są normalne. Ponadto ($\ref{A.12}$) i ($\ref{A.13}$) wskazują, że rozkład gamma dotyczy funkcji statystyk $\kappa_n =n F\left ( X_{(r)}\right) $ i $\eta_n =n F\left ( X_{(r)}\right) $, a nie samych statystyk, które są równe

$$\begin{equation}  X_{(r)} =F^{-1} \left (  \cfrac{\kappa_n}{n}\right ),   \quad  X_{(n-s+1)} =F^{-1} \left (  \cfrac{\eta_n}{n}\right ) \label {A.8} \end{equation}$$

Zagadnienie rozkładu wartości skrajnych jest złożone i stanowi przedmiot teorii wartości ekstremalnych, rozpatrywanej oddzielnie dla wartości małych i dużych.

W celu uproszczenia zapisów dalszą analizę będziemy prowadzili na zmiennych standaryzowanych:

$$\begin{equation}  Y =\cfrac{X  – \alpha}{ \beta }\label {A.9} \end{equation}$$

Dla wartości zmiennej $x$ wartość zmiennej y wynosi $ y=\tfrac {x-\alpha} { \beta} $,

gdzie $\alpha $ -parametr położenia  i $\beta $ – parametr skali  stałe normujące rozkładu, które wyznaczymy w dalszej części pracy. Rozkłady wartości ekstremalnych mają też trzeci parametr $\gamma$ -parametr kształtu, który jest specyfikowany w miarę potrzeb.  Standardowo parametry rozkładów estymuje (wyznacza)  się na podstawie danych doświadczalnych lub innych, charakterystycznych warunków opisywanego zjawiska.

Rozkłady największych wartości

Dystrybuanty ekstremalne maksimów s-tej statystyki porządkowej $Y_{(s)}= \cfrac { X_{(n-s+1)} -\alpha_n}{\beta_n },  \quad s >1 $ :

$$\begin{equation}  \lim_\limits {n \to \infty } Pr \{  Y_{(s)} \le y \}    = G_s(y)  \label {A.10} \end{equation}$$

mogą przyjmować postać wyłącznie w trzech typach ( podajemy bez warunków koniecznych i wystarczających):

Typ I max (Gumbela największych wartości)

dla $ -\infty < y < \infty : \quad  G^{I} _{max} (y) =\sum \limits_{r=0}^{m-1} \pi_r \left ( e^{-y}\right )$

$$\begin{equation}  ⇒ \quad G^{I} _{max} (y) = exp [ -exp (-y)]  \label {A.11}  \end{equation}$$

z parametrami rozkładu:  $\alpha=x_F$,  $\beta=x_F-\gamma$

Typ II max (rozkład Frecheta)

dla $y \le 0 \quad  G^{II}_{max} (y)= 0 $
dla $y>0 \quad G^{II}_{max} (y) = \sum \limits_{r=0}^{m=1} \pi_r (y^{-a})$,  $(a>0)$

$$\begin{equation}  ⇒ \quad G^{II} _{max} (y) = exp [ ( -y)^{-a} ]  \label {A.12}  \end{equation}$$

z parametrami rozkładu: $\alpha= 0$,  $\beta = \gamma$

Typ III max

dla   $y \le 0: \quad$   $G^{III} _{max} (y) =\sum \limits_{r=0}^{m-1} \pi_r \left ( |y|^a \right )$,  $(a>0)$
dla   $y>0: \quad G^{III} _{max} (y) =1$

$$\begin{equation}  ⇒ \quad G^{III} _{max} (y) =  exp [ – (-y)^{-a}]  \label {A.13}  \end{equation}$$

z parametrami rozkładu:   $\alpha_n=x_F$,  $\beta = x_F-\gamma$

Powyżej wprowadzono  oznaczenia:
$F(x)$ – pewna funkcja rozkładu,
$f(x)$ – gęstość prawdopodobieństwa tej funkcji,
$ \gamma =inf \{ x: F(x) \ge 1 -\cfrac{1}{n} \}$,
$ x_F = sup  \{ x: F(x) < 1 \}$,
$\pi_k (t)=e^{-t} \cdot \tfrac {t^k} {k!}, \quad (k=0,1,2, …) $

Rozkłady najmniejszych wartości

Najmniejsze wartości $X_{(r)}=-X^{‚}_{(n-s+1)}$  dla szeregu wariacyjnego $ – X^{′} _{(1)} \le … \le -X^{′} _{(k)}\le – X^{′} _{(n)}$, próby $(-X_1,. .. ,-X_k, …, -X_n)$, więc rozkłady statystyki najmniejszych wartości  $X_{(r)}, \quad (r \le1)$, można otrzymać przez proste przemodelowanie rozkładów największych wartości. Wystąpią również trzy typy:

Typ I min (Gumbela najmniejszych wartości)

$$\begin{equation}  ⇒ \quad G^{I} _{min} (y) =1-  exp [ -exp (y) ]  \label {A.14}  \end{equation}$$

Typ II min

$$\begin{equation}  ⇒ \quad G^{II} _{min} (y) = 1- exp [ – (-y)^a ]  \label {A.15}  \end{equation}$$

Typ III min (Weibulla)

Rozkłady Gumbela

Dokładniej przedstawimy rozkłady Gumbela maksimów i minimów, czyli rozkłady I typu wartości ekstremalnych Fisher-Tippet-Gniedienko. Rozkład Gumbela jest również nazwany podwójnie wykładniczym, lub rozkładem log-Weibull.

Rozkład Gumbela największych wartości jest powszechnie stosowany do wyznaczania obciążenia śniegiem.  Rozkład Gumbela minimów został przyjęty do opisu imperfekcji przez Bj¢rhovde (Bjerhovde, 1972). W niniejszej pracy do opisu imperfekcji, traktowanych, jako wymuszenia (obciążenie) przyjęto rozkład Gumbela maksimów.

Rozkład Gumbela największych wartości

Dla unormowanej zmiennej ($\ref{A.9}$)  dystrybuanta F() i funkcja gęstości f() rozkładu Gumbela największych wartości może być zapisana formułami:

$$\begin{equation}   F ( y, \alpha, \beta) = \exp {\left ( – e^{-y} -y \right )} \label {A.18}  \end{equation}$$

$$\begin{equation}   f ( y, \alpha, \beta) = \exp{ \left ( – e^{-y} \right ) } \label {A.19}  \end{equation}$$

Moda i mediana rozkładu wynosi

$$\begin{equation}   Mod [X] = \alpha \\
Med [X] = \alpha – \beta \cdot \ln {( \ln {2} }
\label {A.19a}  \end{equation}$$

a wartość oczekiwana :

$$\begin{equation}  E [X] = \alpha + C_E \cdot \beta  \label  {A.20}  \end{equation}$$

gdzie  – stała $C_E= 0,57721 $ – stała Eulera.

Wariancja $Var[X]$ i odchylenie standardowe $\sigma$ wynosi:

$$\begin{equation}  Var[X] =\cfrac{\pi^2 \beta ^2}{6} \approx 1,645 \beta^2  \label {A.21} \\
\sigma=\sqrt{Var[Y]}= \cfrac{ \pi \beta}{\sqrt{6}} \approx 1,283 \beta
\end{equation}$$

Najbardziej wiarygodną statystką wartości centralnej rozkładu Gumbela oszacowaną metodą największej wiarygodności z próby  N pomiarów  $x_i$ zmiennej $X$ jest

$$\begin{equation}   \alpha \approx \left ( \cfrac{1}{N} \sum \limits_{i=1} ^N  e^{ – \tfrac {x_i}{\beta} }  \right )^{-\beta} \label  {A.22}  \end{equation}$$

Estymacja metodą momentów umożliwia oszacowanie parametrów rozkładu ($\ref{A.18}$ ) na podstawie klasycznej  wartości średniej  $m=\tfrac{1}{N}  \sum \limits_{i=1} ^N   x_i $ i kwadratu odchylenia standardowego $ \sigma^2= \tfrac{1}{N-1} \sum \limits {i=1} ^N  ( x_i-m)^2 $ z wyników z pomiarów. Wzory na kolokację rozkładów prawdopodobieństwa z parametrów rozkładu normalnego z próby na rozkład Gumbela są następujące (Murzewski, 1989) [100] :

$$\begin{equation}  \alpha \approx  m- (C_E \cdot [ \sqrt{6 } / \pi \cdot \sigma = m- 0,45 \sigma)  \\
\beta = \sqrt{6} / \pi \cdot \sigma= 0,780 \sigma \label {A.23}\end{equation}$$

Kwantyl p-tego rzędu jest wartością  zmiennej $x_p$ , której przekroczenie zachodzi z prawdopodobieństwem p : $(Pr \left \{  X>x_p \right \} = F[x_p] =p $ , dla rozkładu maksimów Gumbela jest funkcją elementarną :

$$\begin{equation}   x_P= F^{-1} (p) = \alpha – \beta \ln {[ – \ln {(p)} ]}  \label  {A.24}  \end {equation}$$

Rozkład Gumbela najmniejszych wartości

Dystrybuanta i funkcja gęstości rozkładu Gumbela najmniejszych wartości mogą być zapisane formułami:

$$\begin{equation}   F ( y, \alpha, \beta) = \exp { \left ( – e^y  \right ) } \label {A.25}  \end{equation}$$

$$\begin{equation}   f ( y, \alpha, \beta) = \cfrac{1}{\beta} \exp { \left ( – e^y +y \right )} \label {A.26}  \end{equation}$$

Znaczenie parametrów rozkładu, moda, mediana, wariancja i odchylenie standardowe wynoszą ($\ref{A.19a}$), ($\ref{A.21}$), ($\ref{A.22}$), czyli są takie jak dla rozkładu Gumbela maksimów, ale wartość oczekiwana i funkcja kwantyla różnią się i wynoszą:

$$\begin{equation}  E [X] = \alpha – C_E \cdot \beta  \label  {A.27}  \end{equation}$$

$$\begin{equation}    x_p= F^{-1} (p) = \alpha + \beta ln [ – \ln {(p)} ]  \label  {A.28}  \end {equation}$$

Rozkład Weibulla

Rozkład Weibulla jest rozkładem określonym na przedziale $(\alpha, \, \infty)$ , gdzie $\alpha$  jest parametrem położenia, z kształtem określonym dwoma parametrami: skali $\beta$ oraz kształtu $\gamma$. W zależności od tych trzech parametrów rozkład Weibulla może przyjmować rozmaitą formę od unimodalnej ( z pojedynczym ekstremum lokalnym), poprzez monotoniczną i asymptotyczną. Rozkład Weibulla jest czasami określany, jako rozkład Rosin-Rammler.

Dla unormowanej zmiennej ($\ref{A.9}$)  dystrybuanta F() i funkcja gęstości f() rozkładu Weibulla może być zapisana formułami:

$$\begin{equation}   F ( y, \alpha, \beta, \gamma) = 1- \exp {\left ( y^{\gamma}  \right ) } \label {A.29}  \end{equation}$$

$$\begin{equation}   f ( y, \alpha, \beta, \gamma)=  \cfrac{1}{\beta} \exp  {\left (  (-y)^{\gamma} \cdot \alpha y^{ (\alpha -1) }  \right )} \label {A.30}  \end{equation}$$

gdzie: parametry i  wyznacza się na podstawie danych doświadczalnych lub fizycznych warunków brzegowych, wynikających z charakterystycznych cech opisywanego zjawiska.

Wartość oczekiwana:

$$\begin{equation}   E[X] = \alpha + \beta \cdot \Gamma (1+\cfrac{1}{\gamma}) \label {A.31}  \end{equation}$$

gdzie  $\Gamma()$ – stablicowana funkcja gamma.

Mediana

$$\begin{equation}   Med [X] = \alpha + \beta \cdot \ln{(2)}^{1/ \gamma} \label {A.32}  \end{equation}$$

Wariancja

$$\begin{equation}   Var [X] =  \beta^2  [ – \Gamma (1+1 /\gamma)^2 + \Gamma (1+2 / \gamma)]  \label {A.33}  \end{equation}$$

Odchylenie standardowe

$$\begin{equation}   \sigma= \sqrt{ \Var[X] } =  \beta \cdot \sqrt{ [ – \Gamma (1+1 /\gamma)^2 + \Gamma (1+2 / \gamma)]}  \label {A.34}  \end{equation}$$

Estymatory parametrów rozkładów ekstremalnych

Wartość centralna rozkładu prawdopodobieństwa jest punktem skupienia rozkładu, do której dąży zmienna wraz ze zmniejszaniem rozproszenia losowego. Punktem centralnym w przypadku rozkładu normalnego jest wartość oczekiwana, a jej najbardziej wiarygodnym, nieobciążonym i najlepszym estymatorem z eksperymentalnej próby jest wartość średnia. Estymacja metodą momentów umożliwia oszacowanie parametrów rozkładów ekstremalnych na podstawie znanej wartości średniej i wariancji  wyników z pomiarów. W kol (3) tab. A.1 zestawiono wybrane estymatory wartości centralnych, otrzymane metodą największej wiarygodności, a w kol (4) i (5) estymatory parametrów rozkładów otrzymane metodą momentów (Murzewski, 1989) [112].

Tab. A.1 Estymatory parametrów rozkładów ekstremalnych

Uwagi o zastosowaniu oprogramowania

Funkcja GumbelDistribution() w programach Matlab [P11] i Mathematica [P9] dotyczy rozkładu Gumbela dla minimalnych wartości ekstremalnych. W celu wyznaczenia wartości maksimum należy przyjąć ujemne wartości oryginalne, to jest negatywną wartość oraz parametr mody (przesunięcia) lub zastosować funkcję o nazwie ExtremeValueDistribution().

Rozkład Weibulla (III typ minimów) dostarcza funkcja WeibullDistribution().

Każdy rozkład prawdopodobieństwa, w tym rozkład Gumbela można ograniczyć z góry i dołu w celu reprezentowania rozkładu wartości cenzurowanych między górną i dolną wartością (funkcja CensoredDistribution() Mathematica [M10], lub też można zastosować obcięcie rozkładu w celu reprezentowania rozkładu wartości obciętego między wartościami górną i dolną (funkcja, TruncatedDistribution().Mathematica [M10], lub też z użyciem funkcji ProductDistribution() można wyznaczyć łączny rozkład z niezależnych dystrybuant brzegowych, co jest stosowane dla łącznego rozkładu imperfekcji łukowych i przechyłowych lub imperfekcji sprężystych i plastycznych.

 

Comments : 0
O autorze
* dr inż. Leszek Chodor. Architekt i Inżynier Konstruktor; Rzeczoznawca budowlany. Autor wielu projektów budowli, w tym nagrodzonych w konkursach krajowych i zagranicznych, a między innymi: projektu wykonawczego konstrukcji budynku głównego Centrum "Manufaktura" w Łodzi, projektu budowlanego konstrukcji budynku PSE w Konstancinie Bielawa, projektów konstrukcji "Cersanit" ( Starachowice, Wałbrzych, Nowograd Wołyński-Ukraina), projektu konstrukcji hali widowiskowo-sportowej Arena Szczecin Autor kilkudziesięciu prac naukowych z zakresu teorii konstrukcji budowlanych, architektury oraz platformy BIM w projektowaniu.
Translate »