\pagestyle{plain}‬
\vspace{30mm}
\chapter{تعاریف و مفاهیم   }
\label{chapter1}
 \baselineskip=.90cm
\thispagestyle{empty}
 \vspace{-80mm}
\begin{flushleft}
\begin{small}
نیمی از ریاضیات ابداع علامتی مناسب برای آن است.\\
\vspace{3mm}
"لاپلاس"
\end{small}
\end{flushleft}
\vspace{50mm}
\newpage
\section{ مقدمه  }
علاقه مردم به رکوردها از محبوبیت رکوردهای جهانی گینس مشهود است. 
یک مشاهده یک رکورد (بالا) نامیده می‌شود هرگاه مقدار آن از تمامی مشاهدات 
قبلی بیشتر شود. رکوردها در زمینه‌های گوناگونی از جمله هواشناسی، آبشناسی، اقتصاد و ورزش بکار می‌روند.
 رکوردها همچنین نقش مهمی در شاخص‌سازی داده‌های آب و هوا به منظور آگاهی عموم  از تغییرات  آب و هوایی و گرمای 
 جهانی دارند. به عنوان مثال می توان به تحلیل اخیر مرکز ملی دادهای آب و هوای ایالات متحده اشاره کرد که مشخص ساخت 
 متوسط دماهای توام سطح زمین و اقیانوس در جهان، در ماههای ژوئن و ژانویه تا اواسط 
 ژوئن در $2010$، رکوردهای دما هستند.
تحلیل داده‌های بارندگی بر مبنای رکوردها به دلیل برخی محدودیتهای فرآیند جمع‌آوری داده‌ها بسیار با اهمیت است.  
متغیرهای آب و هوا بخصوص رخداد و شدت بارندگی اثرات مهمی بر انسان و محیط دارند. دوره‌های آب و هوایی خشک و بدون باران می‌توانند 
پیامدهای موثری بر سطوح آب زیر زمینی تامین کننده آب، گیاهان و میزان محصول داشته باشند، در حالیکه بارش پیاپی باران ممکن است موجب 
 سیل شود که اغلب هزینه‌های زیادی از نظر انسانی، اقتصادی و سیستم‌های محیطی دارد. بنابراین اطلاع از فراوانی 
 رخداد و شدت بارش برای برنامه‌ریزی، طراحی و مدیریت سیستم‌های منابع گوناگون آب ضروری است. \\
برای نمونه، در مدیریت سیستم‌های آب شهری و روستایی، فرآیندهای آبشناسی مهم از قبیل جریان سطحی، تصفیه و فرسایش غالباً
 با استفاده از مدل‌های شبیه‌سازی که به داده‌های بارش به عنوان ورودی نیاز دارند انجام می شود. 
 در این پایان‌نامه برای مدل‌بندی اینگونه داده‌ها از توزیع نمایی تعمیم یافته استفاده 
 می‌شود. این توزیع که توسط گوپتا و کاندو (۱۹۹۹) معرفی شد، در حالت‌هایی بکار می رود که توزیعی چوله برای یک متغیر تصادفی نامنفی 
 مورد نیاز باشد. برای اینگونه متغیرها توزیع‌های دیگری نیز می‌توان استفاده کرد اما همانطور که گوپتا و کاندو (۱۹۹۹) خاطر نشان کرده‌اند
 توزیع‌های گامای سه پارامتری و وایبل سه پارامتری هرگاه پارامتر شکل یک عدد صحیح نباشد
  اشکالاتی از قبیل دشواری محاسباتی تابع بقا دارند هر چند که آن‌ها متداولترین توزیع‌ها در تحلیل داده‌های طول عمر هستند.
\lr{Raqab} (۲۰۰۱)
فاصله های پسش بینی 
\lr{(HCD)}
برای رکوردهای آینده را از توزیع نمایی بر پا نهاد.
\lr{Raqab} (۲۰۰۲)
 بهترین برآوردگر نااریب از پارامترهای مکانی و مقیاسی از توزیع نمایی تعمیم یافته را بررسی کرد و بر روی پیش بینی
رکوردهای آینده بحث کرد.
\lr{Donsmor}
 در سال ۱۹۸۳ مسئله پیش بینی بیزی از رکوردهای آینده از توزیع نمایی را عنوان کرد. 
\lr{Smith}
 و 
\lr{Miller}
 در سال ۱۹۸۶ کلاسی از مدل های وضعیت های پایایی ناگاوسی ارائه کردند و برای مشاهدات سانسور شده و غیر سانسور شده پیش بینی هایی را انجام داده و بحث 
کردند. اخیرا الحسینی و احمد در سال ۲۰۰۳ مسئله پیش بینی از فاصله های بیزی از رکوردهای آینده را با استفاده از کلاس کلی از 
توزیع ها مورد بررسی قرار داده اند.
\lr{Madi}
 و 
\lr{Rapub}
 در سال ۲۰۰۴ مسئله پیش بینی را برای مدل پارتو مورد بحث قرار دادند. 
\lr{Jafeeh}
 در سال ۲۰۰۳ برآوردهای بیزی برای
دو پارامتر از مدل 
\lr{Jompeaz}
 را بدست آورد و پیش بینی رکوردهای بالایی را تعیین کرد.

 در این پایان‌نامه موضوع‌های زیر به ترتیب مورد بحث قرار می‌گیرند. در فصل اول با آماره‌های رکورد و 
 برخی خواص آن‌ها آشنا می‌شویم. تعاریف مورد نیاز نیز در این فصل ارائه می‌شوند. 
 در ادامه این فصل توزیع نمایی تعمیم یافته و ویژگی‌های آن بررسی می‌شود.
 کارهایی که در این زمینه انجام گرفته نیز در این فصل مورد بحث و بررسی قرار می‌گیرد.
در فصل دوم به برآورد بیزی پارامترهای توزیع نمایی تعمیم یافته می‌پردازیم و الگوریتم‌های مورد نیاز نیز در این 
 فصل ارائه می‌شوند. در فصل سوم پیشگوهای بیزی را از رکوردهای بعدی بدست می‌آوریم. در فصل چهارم مقایسه به صورت 
 شبیه‌سازی ارائه می‌شود. 
\section{رکوردها و    توزیع نمایی تعمیم یافته} 
\subsection{آماره‌های ترتیبی }
فرض کنید $x_1,x_2,...,x_n$ نمونه تصادفی به حجم $n$ با تابع توزیع تجمعی $F(.)$ باشد. در اینصورت
 $y_1\leq y_2\leq ...\leq y_n$ آماره‌های ترتیبی متناظر با نمونه تصادفی  $x_1,x_2,...,x_n$ تعریف می‌شوند 
 که در آن‌ها $y_i$ها همان $x_i$ها هستند که بصورت صعودی مرتب شده‌اند. توجه شود که $y_i$ها آماره (توابعی از نمونه تصادفی  $x_1,x_2,...,x_n$) 
بوده و مرتب نیز می‌باشند. بر خلاف خود نمونه تصادفی، آماره‌های ترتیبی بوضوح مستقل نیستند، زیرا اگر $y_i\geq y$ آنگاه $y_{i+1}\geq y$ است.
این آماره‌ها در موقعیت‌هایی نظیر هواشناسی، آبشناسی، زلزله‌شناسی و استخراج معدن استفاده می‌شوند.\\
فرض کنید $x_1,x_2,...,x_n$ نمونه تصادفی از تابع چگالی احتمال $f(.)$ با تابع توزیع تجمعی $F(.)$
 باشد و $y_1\leq y_2\leq ...\leq y_n$ آماره‌های ترتیبی متناظر را نشان دهند، در اینصورت
\begin{eqnarray}
&&f_{y_{\alpha}}(y)=\frac{n!}{(\alpha-1)!(n-\alpha)!}[F(y)]^{\alpha-1}[1-F(y)]^{n-\alpha}f(y),\nonumber \\
&&f_{y_{\alpha},y_{\beta}}(x,y)=\frac{n!}{(\alpha-1)!(\beta-\alpha-1)!(n-\beta)!}[F(x)]^{\alpha-1}\times \nonumber\\ 
&&[F(y)-F(x)]^{\beta-\alpha-1}[1-F(y)]^{n-\beta}f(x)f(y),\nonumber
\end{eqnarray}
\begin{displaymath}
f_{y_1,y_2,...,y_n}(y_1,y_2,...,y_n)=\left\{\begin{array}{ll}n!f(y_1)f(y_2)...f(y_n) & y_1<y_2<...<y_n,\\
0 & {\mbox{.سایر نقاط‍ }}
\end{array}\right.
\end{displaymath}
هر مجموعه از توزیع‌های کناری را از چگالی توام $f_{y_1,y_2,...,y_n}(y_1,y_2,...,y_n)$ با انتگرالگیری نسبت به متغیرهایی که مورد نظر نیستند،
 می‌توان بدست آورد.\\
\subsection{رکوردها}
هنگامی که بدست آوردن مشاهدات دشوار است یا وقتی که مشاهدات 
 تحت آزمون از بین می‌روند رکوردها بسیار مهم هستند.
آماره‌های رکورد به عنوان مدلی برای مقادیر کرانگین متوالی در دنباله‌ای از متغیرهای تصادفی همتوزیع و مستقل 
 از قبیل بیشترین ادعاهای متوالی خسارت از بیمه در بیمه غیر عمر، بیشترین سطوح آب یا بیشترین دماها، تعریف می‌شوند. 
 رکوردها همچنین در نظریه قابلیت اعتماد بکار می‌روند. فرض کنید یک سیستم فنی در معرض شوک‌هایی به عنوان مثال بیشینه‌های ولتاژ
 قرار گیرد. اگر شوک‌ها به عنوان تحقق‌هایی از یک دنباله مستقل و همتوزیع در نظر گرفته شوند، در اینصورت مدل 
 آماره‌های رکورد (مقادیر ولتاژهای  بیشینه متوالی) مناسب است. در نتیجه بطور طبیعی پیشگویی رکوردهای آینده در این زمینه 
 پیش می‌آید.     ساده‌ترین راه برای تعریف آماری نظریه 
 رکوردها استفاده از مثال است.\\
{مثال:}
 فرض کنید $10$ مشاهده از آزمایشی مفروض داریم:
\begin{eqnarray}
10,12,6,15,20,18,17,5,22,3
\end{eqnarray}
در اینصورت مقادیر رکورد پایین عبارتند از $10,6,5,3$،\\
و مقادیر رکورد بالا عبارتند از $10,12,15,20,22$.\par
  چاندلر  نخستین کسی بود که مفهوم مقادیر رکورد، زمان‌های رکورد و زمان‌های رکورد میانی را برای تحلیل داده‌های شکست استحکام
نوع خاصی از مواد، بررسی کرد. وی این نتیجه را اثبات کرد که برای هر تابع توزیع احتمال مفروض 
 یک متغیر تصادفی، مقدار مورد انتظار زمان میانه رکوردهای نامتناهی است. \\
حال به چند تعریف که نقش اساسی در بررسی حاضر دارند می‌پردازیم.\par
تعریف ۱. فرض کنید $X_1,X_2,...,X_n$ دنباله‌ای از متغیرهای تصادفی مستقل و همتوزیع با تابع توزیع احتمال تجمعی $F(x)$
 باشند. گیریم به ازای $n\geq1$، $X_n=min\{X_1,X_2,...,X_n\}$ باشد. گوییم $X_j$ یک مقدار رکورد پایین 
  $\{X_n,n\geq1\}$ است هرگاه به ازای $j>1$، $X_j<X_{j-1}$. تعریف مشابهی نیز برای مقادیر رکورد بالا وجود دارد. طبق تعریف،
 $X_1$ یک مقدار رکورد پایین و همچنین یک مقدار رکورد بالا است.\par
اندیسهایی که در آن‌ها مقادیر رکورد پایین رخ می‌دهند با زمان‌های رکورد مشخص می‌شوند $\{L(r),r>0\}$، که در آن 
 $L(r)=min\{j|j>L(r-1),X_j<X_{L(r-1)},r>1\}$ و $L(1)=1$. \par
تابع توزیع احتمال توام $f(x_1,x_2,...,x_n)$ مربوط به $r$ مقدار رکورد پایین $X_{L(1)},X_{L(2)},...,X_{L(r)}$ از یک تابع توزیع احتمال تجمعی پیوسته
 $F(x)$، بصورت 
\begin{eqnarray}
f_{1,2,...,r}(x_1,x_2,...,x_r)=f(x_r)\prod_{i=1}^{r-1}\frac{f(x_i)}{F(x_i)},
\end{eqnarray}
به ازای $-\infty<x_1<x_2<...<x_{r-1}<x_r<\infty$، داده می‌شود. \\
تابع چگالی احتمال $X_{L(r)}$ بصورت
\begin{eqnarray*}
f_r(x)=\frac{1}{\Gamma(r)}(-\ln (F(x)))^{r-1}f(x) , \ -\infty<x<\infty
\end{eqnarray*}
داده می‌شود و تابع توزیع احتمال تجمعی $X_{L(r)}$ بصورت 
\begin{eqnarray}
F_r(x)&=&\frac{1}{\Gamma(r)}\int_{-\infty}^x(-\ln (F(x)))^{r-1}f(x)dx \nonumber\\
&=&1-\Gamma_{-ln(F(x))}(r),
\end{eqnarray}
داده می‌شود. \\
تابع چگالی احتمال توام دو مقدار رکورد پایین $X_{L(r)}$ و $X_{L(s)}$ بصورت 
\begin{eqnarray}
f(x_r,x_s)=\frac{1}{\Gamma(r)\Gamma(s-r)}(-\ln (F(x_r)))^{r-1}[\ln (F(x_r))-\ln(F(x_s))]^{s-r-1}\frac{f(x_r)}{F(x_r)}f(x_s),
\end{eqnarray}
داده می‌شود که در آن $-\infty<x_s<x_r<\infty$ است (آرنولد، بالاکریشنان و ناگاراجا، ۱۹۹۸).
فرض کنید $W_k$ زمان رکورد میانی سپری شده بعد از رخداد رکورد $k-1$ام و تا رخداد $k$ام ، $k=1,2,...$، باشد. در اینصورت 
 $W_1=L(1)=1$ و $W_k=L(k)-L(k-1)$، $k=2,3,...$. راینی (۱۹۶۲) با فرض اینکه $X_i$، $i=1,2,...$ دنباله‌ای از متغیرهای تصادفی 
مستقل و همتوزیع با تابع توزیع تجمعی مطلقاً  پیوسته $F(x)$ باشد، تابع احتمال تعداد $N_n$ رکورد تا زمان $n$ را بر حسب اعداد استرلینگ 
 بدون علامت نوع اول، بدست آورد. به عنوان یک فرع تابع احتمال زمان $L(k)$ رکورد $k$ام بر حسب اعداد مشابهی بیان شده است. نوتس (۱۹۶۷)
 احتمال دم $P(W_k>n)$ را به عنوان گشتاور (توان) $n$ام تابع $1-\exp(-X)$ بیان کرد که در آن $X$ دارای توزیع گاما با پارامتر مقیاس ۱ و 
 پارامتر شکل  $k$ است. \\
\subsection{توزیع نمایی تعمیم یافته}
توزیع‌های وایبل و گاما معمول‌ترین توزیع‌های طول عمر هستند. هر دو توزیع مورد بررسی افراد مختلفی قرار گرفته‌اند و کاربردهای متنوعی 
 در زمینه‌های دیگری غیر از توزیع‌های طول عمر دارند (الکساندر، ۱۹۶۲؛ جکسون، ۱۹۶۹ و کینکن، ۱۹۶۱). متاسفانه هر دو توزیع 
 مشکلاتی دارند. مشکل اصلی توزیع گاما این است که اگر پارامتر شکل آن عدد صحیح نباشد، تابع توزیع یا تابع بقای آن را نمی‌توان 
 براحتی محاسبه نمود. از اینرو فرد باید تابع توزیع، تابع بقا یا تابع نرخ شکست آن را با استفاده از جداول ریاضی یا نرم‌افزار محاسبه کند.
این موضوع موجب عدم محبوبیت توزیع گاما در مقایسه با توزیع وایبل که تابع توزیع، تابع بقا و تابع نرخ شکست آن را می‌توان به آسانی محاسبه کرد،
  شده است. توزیع وایبل اغلب بدلیل راحتی کار با آن به خصوص در حضور مشاهدات سانسور شده به توزیع گاما ترجیح داده می‌شود. همچنین 
 در بسیاری از داده‌های مثبت مشاهده شده است که توزیع وایبل برازش خیلی خوبی دارد. اما توزیع وایبل نیز معایبی دارد. بین (۱۹۷۸) بیان می‌کند که 
 برآوردگرهای ماکسیمم درستنمایی پارامترهای وایبل ممکن است برای تمامی مقادیر پارامتر حتی وقتی پارامتر مکان صفر باشد، رفتار مناسبی نداشته باشند.
هنگامی که پارامتر شکل بزرگتر از یک باشد، توابع نرخ شکست توزیع گاما و توزیع وایبول هر دو توابعی صعودی هستند. اما در حالت توزیع گاما
 این تابع از صفر تا یک مقدار متناهی (عکس پارامتر مقیاس) افزایش می‌یابد؛ در حالی که در حالت توزیع وایبل از صفر تا بینهایت افزایش می‌یابد،
 که ممکن است در برخی مواقع مناسب نباشد.\par
 توزیع گاما دارای نسبت درستنمایی مرتب نسبت به پارامتر شکل است هرگاه پارامتر مکان و مقیاس ثابت باشند. بطور طبیعی این موضوع منجر به 
 ترتیب در نرخ شکست و همچنین توزیع می‌شود. بنابراین نتیجه می‌شود که هرگاه پارامترهای مکان و مقیاس ثابت باشندُ تمام گشتاورها توابعی صعودی از
 پارامتر شکل هستند. همچنین بدلیل ویژگی ترتیب نسبت درستنمایی، اگر پارامترهای مکان و مقیاس معلوم باشند، می‌توان پرتوانترین آزمون بطور یکنواخت 
 را برای آزمون فرضیه یکطرفه برای پارامتر شکل را بدست آورد.اما خانوداه توزیع‌های وایبل دارای چنین ویژگی ترتیبی نیستند و پرتوانترین آزمون 
 بطور یکنواخت برای آزمون فرضیه یکطرفه در مورد پارامتر شکل، حتی در صورت معلوم بودن دو پارمتر دیگر، وجود ندارد.\par
 همانگونه که می‌دانیم هرچند توزیع وایبل دارای نمایش مناسبی به عنوان یک تابع توزیع است اما توزیع مجموع متغیرهای تصادفی مستقل و 
 همتوزیع وایبل را نمی‌توان بسادگی بدست آورد. بنابراین توزیع میانگین نمونه تصادفی از توزیع  وایبل را براحتی نمی‌توان محاسبه کرد.\\
مدولکار، سیرواستاوا و فرایمر (۱۹۹۵)، توزیعی را با یک پارامتر مقیاس و دو پارامتر شکل را با عنوان توزیع وایبل نمایی شده،  پیشنهاد کردند 
 (همچنین مدولکار و سیرواستاوا، ۱۹۹۳ را ببینید). هر دو مقاله داده‌های خاصی را تحلیل کردند و نشان دادند که وایبل نمایی شده که دارای سه پارامتر است 
 برازش بهتری نسبت به وایبل دو پارامتری (پارامتر مکانی صفر قرار داده شده است) یا نمایی تک پارامتری که حالتهای خاصی از وایبل نمایی شده هستند، دارد.
 گوپتا و کاندو (۱۹۹۷) حالت خاصی (نمایی نمایی شده) از مدل  وایبل نمایی شده را را با فرض پارامتر مکانی صفر بررسی کردند و عملکرد آن را با 
 خانواده گامای دو پارامتری و خانواده وایبل دو پارامتری، عمدتاً از طریق تحلیل داده‌ها و شبیه‌سازی‌های  کامپیوتری، مقایسه کردند.  
توزیع نمایی تعمیم یافته عضوی از مدل عمومی نمایی است که دارای دو پارامتر کاملاً انعطاف‌پذیر است که می‌تواند بطور مؤثری در 
 تحلیل داده‌های مثبت طول عمر به جای وایبل و گاما استفاده شود. هرچند توزیع گاما ویژگی‌های خوبی دارد و برای تحلیل داده‌های چوله 
 می‌توان از آن استفاده کرد اما توزیع نمایی دارای صورت خلاصه‌تری است و می‌تواند به جای آن استفاده شود. گومپرتز در سال $1825$
 از توزیع زیر برای نشان دادن رشد مرگ و میر استفاده کرده است:
\begin{eqnarray}
\label{wtv}
G(t)=(1-p\exp(-\lambda t))^{\alpha}, \ \ t>\frac{1}{\lambda^{\ln p}},
\end{eqnarray}
همچنین آهوجا و نش در سال $1967$ از توزیع فوق و برخی از حالت‌های آن برای منحنی مرگ و میر استفاده کرده‌اند. گوپتا و کاندو (۱۹۹۹) 
 حالت خاصی از توزیع بالا را بصورت زیر معرفی کرده‌اند یعنی در رابطه (\ref{wtv}) اگر $p=1$ باشد، آنگاه:
\begin{eqnarray}
\label{dsyq}
F(x,\alpha,\lambda)=(1-\exp(-\lambda x))^{\alpha}, \ \ x>0,
\end{eqnarray}
و این حالت خاصی از وایبل نمایی شده است که توسط مودهولکار و همکارانش در سال  $1995$ ارائه شده است. \\
در واقع رابطه (\ref{dsyq}) تابع توزیع نمایی تعمیم یافته است و $\alpha$ و $\lambda$ نقش پارامترهای شکل و مقیاس را بازی می‌کنند.
\subsection{تفسیر فیزیکی توزیع نمایی تعمیم‌یافته}
در یک سیستم موازی سیستم زمانی کار می‌کند که حداقل یک عضو از این سیستم کار کند. یکی از ویژگی‌های خوب توزیع نمایی تعمیم یافته این است که 
 در بررسی سیستم‌های موازی که از $n$  جز تشکیل شده به کار می‌رود. در توزیع طول عمر اجزا وقتی بصورت مستقل و همتوزیع 
%\begin{figure}[!h]
%\hspace{-20mm}
%\includegraphics[]{n1.jpg}
%\label{دیاگرام}
%\end{figure}
 دارای توزیع نمایی باشند، آنگاه توزیع طول عمر این سیستم بصورت
\begin{eqnarray}
\label{chq}
F(x,n,\lambda)=(1-\exp(-\lambda n))^n, \ x>0, \ \lambda>0,
\end{eqnarray}
که بوضوح رابطه (\ref{chq}) توزیع نمایی تعمیم یافته‌ای است که در آن $\alpha=n$ است و در تقابل با توزیع وایبل قرار دارد
 زیرا توزیع وایبل در سیستم‌های سری کاربرد دارد. \\
\begin{figure}
%\epsfxsize = 5.5in
%\epsfysize = 3.25in
%\includegraphics[]{n1.JPG}
\centering 
\includegraphics[]{n1.JPG}
\caption{نمودار توزیع نمایی تعمیم یافته با مقدار پارامتر مقیاس مساوی ۱ و مقادیر مختلف پارامتر شکل}\label{na}
\end{figure}
%\input{epsf}
%\label{na1}
%\begin{figure}
%\vspace{4.5mm}
%\epsfxsize = 5.5in
%\epsfysize = 3.25in
%\centerline{
%\epsffile{q1.eps}
%\hspace{-293.5mm}}
%\protect\vspace{0cm}\farsi
%\caption{\label{na} نمودار توزیع نمایی تعمیم یافته با مقدار پارامتر مقیاس مساوی ۱ و مقادیر مختلف پارامتر شکل   }
%\english\end{figure}\farsi
چند ویژگی مهم توزیع نمایی تعمیم یافته عبارت است از:
\begin{enumerate}
\item{اگر $x$ متغیری تصادفی از تابع توزیع رابطه (\ref{dyq})} باشد آنگاه تابع چگالی این توزیع با مشتق‌گیری از آن بدست می‌آید 
 و بصورت زیر می‌باشد:
\begin{eqnarray}
f(x,\alpha,\lambda)=\alpha\lambda(1-\exp(-\lambda x))^{\alpha-1}\exp(-\lambda x) \ \alpha,\lambda>0,
\end{eqnarray}
وقتی که‌پارامتر مقیاس  $\lambda=1$ باشد آنگاه به ازای  $\alpha$های متفاوت شکل تابع چگالی بصورت شکل (\ref{na}) است.\\
برای $\alpha\leq1$ مشاهده می‌شود که تابع چگالی بالا نزولی است و برای $\alpha>1$ تابع چگالی تک مدی و چوله به راست می‌باشد
 و در جاهایی که $\alpha\geq1$ باشد و $\lambda=1$، آنگاه مد برابر با $\log\alpha$ و برای $\alpha\leq1$ مد آن صفر است و میانه نیز 
 بصورت زیر محاسبه می‌شود:
\begin{eqnarray}
\int_0^x\alpha\lambda(1-\exp(-\lambda x))^{\alpha-1}\exp(-\lambda x)dx&=&\frac{1}{2}\nonumber \\
\alpha\lambda\int_0^x(1-\exp(-\lambda x))^{\alpha-1}\exp(-\lambda x)dx&=&\frac{1}{2}\nonumber\\
\frac{-\alpha\lambda(1-\exp(-\lambda x))^{\alpha}}{\alpha\lambda}=\frac{1}{2}\nonumber\\
\mbox{میانه }\rightarrow x=\frac{-\ln(1-(0/5)^{1/\alpha})}{\lambda},
\end{eqnarray}


\begin{figure}
%\epsfxsize = 5.5in
%\epsfysize = 3.25in
\centering 
\includegraphics[]{n2.JPG}
\caption{نمودار تابع نرخ شکست   توزیع نمایی تعمیم یافته با مقادیر مختلف پارامتر شکل}\label{nq}
\label{دیاگرام}
\end{figure}
%\input{epsf}
%\label{nq1}
%\begin{figure}
%\vspace{4.5mm}
%\epsfxsize = 5.5in
%\epsfysize = 3.25in
%\centerline{
%\epsffile{f.eps}
%\hspace{-293.5mm}}
%\protect\vspace{0cm}\farsi
%\caption{\label{nq} نمودار تابع نرخ شکست   توزیع نمایی تعمیم یافته با مقادیر مختلف پارامتر شکل}
%\english\end{figure}\farsi
و برای مقادیر بزرگ $\lambda$  می‌توان گفت که میانگین، میانه و مد تقریباً با هم برابر و مساوی با $\log\alpha$ می‌باشند.
\item{نرخ شکست  توزیع نمایی تعمیم یافته بصورت زیر است:
\begin{eqnarray}
H(x,\alpha,\lambda)&=&\frac{f(x,\alpha,\lambda)}{1-F(x,\alpha,\lambda)}\nonumber\\
&=&\frac{\alpha\lambda\exp(-\lambda x)(1-\exp(-\lambda x))^{\alpha-1}}{1-(1-\exp(-\lambda x))^{\alpha}}
\end{eqnarray}
که در آن $\lambda$ پارامتر مقیاس است و شکل تابع زیان  بستگی به $\lambda$ ندارد و فقط به $\alpha$ وابسته است و نمودار آن 
 بصورت شکل (\ref{nq}) است.
}
\end{enumerate}
که به طور واضح اگر $\alpha=1$ باشد دارای نرخ شکست با مقدار ثابت خواهیم بود و اگر $\alpha>1$ باشد تابع نرخ شکست صعودی 
 به ازای $\alpha<1$ تابع نرخ شکست نزولی است. \\
اخیراً معکوس تابع نرخ شکست (خطر) مورد توجه قرار گرفته است که عبارت است از 
\begin{eqnarray}
R(x,\alpha,\lambda)&=&\frac{f(x,\alpha,\lambda)}{F(x,\alpha,\lambda)}\nonumber\\
&=&\frac{\alpha\lambda\exp(-\lambda x)}{1-\exp(-\lambda x)}.
\end{eqnarray}
مشاهده می‌شود که برای همه مقادیر $\alpha$ معکوس تابع برای هر مقدار $x$ تابعی نزولی است.\\
توجه شود که اگر $\alpha=1$ باشدآنگاه $\frac{\lambda\exp(-\lambda x)}{1-\exp(-\lambda x)}$ معکوس تابع نرخ شکست توزیع نمایی است. 
بنابراین معکوس نرخ شکست نمایی تعمیم یافته متناسب با معکوس تابع نرخ شکست نمایی است. \\
\subsection{گشتاورها و اندازه‌های دیگر}
 نتایج این بخش برای توزیع نمایی دو پارامتری ارائه شده است، اما به منظور سادگی و شفافیت فرض می‌کینم $\lambda=1$ است و نتایج را برای $GE(\alpha)=GE(\alpha,1)$
 ارائه می‌دهیم، چون اگر $X\sim GE(\alpha)$، آنگاه $\lambda X\sim GE(\alpha, \lambda)$ است. \par
 اگر $X\sim GE(\alpha)$، آنگاه تابع مولد گشتاور متناظر بصورت
\begin{eqnarray}
\label{dyq}
M(t)=E(e^{tX})=\alpha\int_{0}^{\infty}(1-e^{-x})^{\alpha-1}e^{(t-1)x}dx.
\end{eqnarray}
با جانشینی $y=e^{-x}$ داریم:
\begin{eqnarray}
M(t)=\alpha\int_{0}^{1}(1-y)^{\alpha-1}y^{-t}dy=\frac{\Gamma(\alpha+1)\Gamma(1-t)}{\Gamma(\alpha-t+1)} \ \ (t<1)
\end{eqnarray}
با مشتق‌گیری از $logM(t)$ و محاسبه آن در $t=0$ میانگین و واریانس $GE(\alpha)$ بصورت
\begin{eqnarray}
E(X)=\psi(\alpha+1)-\psi(1) \ \ \mbox{و} \ \ var(X)=\psi'(1)-\psi'(\alpha+1)
\end{eqnarray}
بدست می‌آید، که در آن $\psi(.)$ تابع دای گاما و $\psi'(.)$ مشتق آن است. گشتاورهای مرکزی بالاتر را می‌توان بر حسب توابع چند جمله‌ای و 
 با استفاده از نرم‌افزارهای ریاضی از قبیل $MAPLE$ بدست آورد. اما گشتاورها را می‌توان به شکل سریهایی متناهی یا نامتناهی بسته به این که 
 آیا $\alpha$ صحیح باشد یا نباشد، بدست آورد. چون به ازای $x>0$، $0<e^{-x}<1$ با استفاده از بسط سریهای دو جمله‌ای داریم
\begin{eqnarray}
(1-e^{-x})^{\alpha-1}=\sum_{j=0}^{\infty}(-1)^j{{\alpha-1}\choose j}e^{-jx},
\end{eqnarray}
و رابطه (۱۲) را می‌توان بصورت 
\begin{eqnarray}
M(t)=\alpha\int_{0}^{\infty}\sum_{j=0}^{\infty}(-1)^j{{\alpha-1}\choose j}e^{-(j+1-t)x}dx
\end{eqnarray}
 بازنویسی نمود. از آنجا که مقدار درون مجموع بطور مطلق انتگراپذیر است، با جابجایی مجموع و انتگرال داریم 
\begin{eqnarray}
M(t)=\alpha\sum_{j=0}^{\infty}(-1)^j{{\alpha-1}\choose j}\frac{1}{j+1-t}\quad (t<1).
\end{eqnarray}
مشاهده می‌شود که سریهای نامتناهی جمع‌پذیر، مشتق‌پذیر و اگر $\alpha$ صحیح باشد، تعداد متناهی جمله دارد. از اینرو با $k$بار مشتق‌گیری 
 محاسبه در $t=0$، $k$امین گشتاور بصورت 
\begin{eqnarray}
\mu_k=\alpha k!\sum_{j=0}^{\infty}(-1)^j{{\alpha-1}\choose j}\frac{1}{(j+1)^{k+1}}.
\end{eqnarray}
اگر $X\sim GE(\alpha)$، آنگاه توزیع $X$ همانند توزیع 
\begin{eqnarray}
\label{rfv}
\sum_{j=1}^{[\alpha]}\frac{Y_j}{j+\langle\alpha\rangle}+Z
\end{eqnarray}  
است، که در آن $Y_j$ متغیرهای تصادفی نمایی مستقل و همتوزیع با پارامتر مقیاس ۱ و $Z\sim GE(\langle\alpha\rangle)$، که مستقل از $Y_j$ است.
 در اینجا $\langle\alpha\rangle$ بخش اعشاری و $[\alpha]$ بخش صحیح $\alpha$ را نشان می‌دهد. این نتیجه را می‌توان با نوشتن تابع مولد گشتاور
 رابطه  (۱.۲.۱۹) بر حسب رابطه (۱.۲.۱۲) ثابت کرد. بنابراین اگر $\alpha$ عدد صحیحی مانند $n$ باشد فوراً نتیجه می‌شود که 
 توزیع $X$ همانند توزیع $\sum_{j=1}^{n}Y_j/j$ است. به عنوان یک نتیجه
\begin{eqnarray}
E(X)=\sum_{i=1}^{n}\frac{1}{i} \quad \mbox{و} \quad var(X)=\sum_{i=1}^{n}\frac{1}{i^2}.
\end{eqnarray}
همچنین توزیع $X$ همانند توزیع بزرگترین آماره ترتیبی $Y_j$ها یعنی $Y_{(n)}$ است. جمع‌وندهای $\sum_{j=1}^{n}Y_j/j$ فواصل بین آماره‌های 
 ترتیبی متوالی از یک نمونه نمایی را نمایش می‌دهد (دیوید، ۱۹۷۰ ص. ۱۸). برای عدد صحیح $\alpha$، از عبارت‌های میانگین و واریانس، 
 تساوی‌های زیر نتیجه می‌شود که می‌تواند در مواقع خاصی مورد استفاده واقع گردد:
\begin{eqnarray}
&&\sum_{i=1}^n\frac{1}{i}=n\sum_{j=0}^{n-1}(-1)^j{n-1 \choose j}\frac{1}{(j+1)^2} \\
&&{(\sum_{i=1}^n\frac{1}{i})}^2+\sum_{i=1}^n\frac{1}{i^2}=2n\sum_{j=0}^{n-1}(-1)^j{n-1 \choose j}\frac{1}{(j+1)^3}.
\end{eqnarray}
حال به بررسی چولگی و برجستگی توزیع نمایی تعمیم یافته می‌پردازیم. چولگی و برجستگی بصورت 
\begin{eqnarray}
\sqrt{\beta_1}=\frac{\mu_3}{\mu_2^{3/2}},\quad \beta_2=\frac{\mu_4}{\mu_2^2},
\end{eqnarray}
محاسبه می‌شوند، بطوریکه $\mu_2$، $\mu_3$ و $\mu_4$ به ترتیب گشتاورهای دوم، سوم و چهارم هستند و می‌توان آن‌ها را بر حسب توابع دای گاما و پلی گاما نمایش داد. 
\begin{eqnarray}
\mu_2&=&\frac{1}{\lambda^2}\Big[\psi'(1)-\psi'(\alpha+1)+(\psi(\alpha+1)-\psi(1))^2\Big]\\
\mu_3&=&\frac{1}{\lambda^3}\Big[\psi''(\alpha+1)-\psi''(1)+3(\psi(\alpha+1)-\psi(1))\nonumber\\
&&\times(\psi'(1)-\psi'(\alpha+1))+(\psi(\alpha+1)-\psi(1))^3)\Big]\\
\mu_4&=&\frac{1}{\lambda^4}\Big[\psi'''(1)-\psi'''(\alpha+1)+3(\psi'(1)-\psi'(\alpha+1))^2\nonumber\\&&+4(\psi(\alpha+1)-\psi(1))
(\psi''(\alpha+1)-\psi''(1))\nonumber\\&&+6(\psi(\alpha+1)-\psi(1))^2(\psi'(1)-\psi'(\alpha+1))+(\psi'''(1)-\psi'''(\alpha+1))^4\Big]
\end{eqnarray}
همانطور که از روابط بالا مشاهده می‌شود،
 معیارهای  چولگی و برجستگی، هر دو مستقل از پارامتر مقیاس هستند.\\  
\subsection{برآورد ماکسیمم درستنمایی پارامترها}
 اگر $X_1,X_2,...,X_n$ نمونه تصادفی از توزیع $GE(\alpha, \lambda)$ باشد آنگاه تابع لگ ماکسیمم درستنمایی برابر است با
\begin{eqnarray}
L(\alpha,\lambda)=n\ln\alpha+n\ln\lambda+(\alpha+1)\sum_{i=1}^n\ln(1-\exp(-\lambda x_i))-\lambda\sum_{i=1}^nx_i,
\end{eqnarray}
و اگر نسبت به $\alpha$ مشتق بگیریم خواهیم داشت:
\begin{eqnarray}
\frac{\partial l(\alpha,\lambda)}{\partial\alpha}=\frac{n}{\alpha}+\sum\ln(1-\exp(-\lambda x_i))=0,
\end{eqnarray}
آنگاه برآورد ماکسیمم درستنمایی $\alpha$ برابر است با 
\begin{eqnarray}
\hat{\alpha}(\lambda)=-\frac{n}{\sum\ln(1-\exp(-\lambda x_i)}
\end{eqnarray}
ماکسیمم درستنمایی $\lambda$ را نیز می‌توانیم با مشتق‌گیری نسبت به $\lambda$ بدست آوریم.
با توجه به گوپتا و کاندو (۱۹۹۹)، با استفاده از روش‌های عددی نظیر نیوتون- رافسون  و  حل عددی  معادله 
\begin{eqnarray}
H(\lambda)=[\sum\frac{x_i\exp(-\lambda x_i)/1-\exp(-\lambda x_i)}{\sum\ln(1-\exp(-\lambda x_i))}+\frac{1}{n}\sum\frac{x_i}{1-\exp(-\lambda x_i)}]^{-1},
\end{eqnarray}
$\hat{\lambda}_{MLE}$ را بدست می‌آوریم. \par
 در بخش بعد، رابطه  توزیع گاما با  توزیع نمایی تعمیم یافته بررسی می‌شود.
\section{تقریب توزیع گاما با استفاده از توزیع نمایی تعمیم یافته}
در این بخش تلاش می‌شود توزیع $\Gamma(\alpha,\lambda)$ با توزیع نمایی تعمیم یافته تقریب زده شود. بنابراین به ازای $\alpha$ و $\lambda$ 
 مفروض، مساله عبارت از یافتن $\alpha^{*}$ و $\lambda^{*}$ بگونه‌ای است که $GE(\alpha^{*},\lambda^{*})$ به $\Gamma(\alpha,\lambda)$ نزدیکترین باشد.
 چون هر دو توزیع، دو پارامتر را دارند، بنابراین  دو توزیع باید اندازه‌های  مکانی و مقیاسی یکسانی داشته باشند. به دو راه متفاوت می‌توان به این موضوع 
 دست یافت.\\
روش اول: به ازای $\alpha$ و $\lambda$ مفروض توزیع گاما، میانگین و واریانس توزیع گاما را بر حسب پارامترهای توزیع نمایی نوشته و $\alpha^{*}$ و $\lambda^{*}$ 
را  بدست می‌آوریم. در نتیجه داریم:
\begin{eqnarray}
\label{trd}
\alpha&=&\frac{(\psi(\alpha^{*}+1)-\psi(1))^2}{(\psi'(1)-\psi'(\alpha^{*}+1))},\\
\label{eop}
\lambda^{*}&=&\frac{\lambda}{\alpha}(\psi(\alpha^{*})+1)-\psi(1))
\end{eqnarray}
بنابراین به ازای $\alpha$ و $\lambda$ مفروض، $\alpha^{*}$ را می‌توان با حل معادله(۱.۳.۳۱) بدست آورد و آنگاه $\lambda^{*}$ را می‌توان 
 از رابطه (۱.۳.۳۲) می‌توان بدست آورد. این جفت را بصورت  $(\alpha_1^*,\lambda_1^*)$ نشان می‌دهیم. \\
روش دوم: در این روش، بجای نوشتن دو گشتاور $\Gamma(\alpha,\lambda)$ و $GE(\alpha^*,\lambda^*)$ بر حسب یک معادله، دو گشتاور $L$ توزیع‌ها  را  برای 
 حل $\alpha^*$ و $\lambda^*$ بصورت یک  معادله می‌نویسیم. برای $\alpha$ و $\lambda$ مفروض، $\alpha^*$ را می‌توان با حل
\begin{eqnarray}
\frac{\Gamma(\frac{1}{2})\Gamma(\alpha+1)}{\Gamma(\alpha+\frac{1}{2})}=\frac{\psi(\alpha^*+1)-\psi(1)}{\psi(2\alpha^*+1)-\psi(\alpha^*+1)}
\end{eqnarray}
بدست آورد.\\
وقتی $\alpha$ بدست آمد، $\lambda^*$ را می‌توان از معادله (۱.۳.۳۲) بدست آورد. این جفت را با $(\alpha_2^*,\lambda_2^*)$ نشان می‌دهیم.\\
گوپتا و کاندو (۱۹۹۹) نشان دادند که $GE(\alpha_2^*,\lambda_2^*)$ در مقایسه با $GE(\alpha_1^*,\lambda_1^*)$ به گاما نزدیکتر است. 
  