PDA

Orijinalini görmek için tıklayınız : Pareto Dağılımı


Koxper
01-14-2010, 17:49
Pareto Dağılımı

Olasılık kuramı ve istatistik bilim dallarında Pareto dağılımı birçok pratik uygulaması bulunan ve "küçük" bir nesnenin bir "büyük" nesneye dağılımında kararlılık elde edildiği hallerde kullanılan bir sürekli olasılık dağılımı veya bir güç kuramıdır. İlk olarak bir İtalyan iktisatçısı olan Vilfredo Pareto tarafından ekonomilerde bireylerin servet dağılımını göstermek için kullanılmıştır. İktisat bilim dalı dışında bu dağılım Bradford dağılımı adı altında da bilinmektedir.

Uygulama alanları

Pareto dağılımı iktisat dışında, sosyal bilimler, fen, geofizik, sigortacılık ve birçok gözümlenen doal fonomen incelemeleri için geniş bir alanda uygulanabilimektedir.


İktisatta, Wilfredo Pareto'nun ilk defa gösterdiği gibi, herhangi bir ülke veya idarî birim içinde servetin veya gelirin büyük bir kısmının incelenen sosyetenin küçük bir bireyler grubu tarafından sahip olunduğunu bu dağılım çok bariz bir şekilde göstermektedir. Bu öneri biraz daha az bilimsel olarak bazan Pareto prensipi veya 80-20 ilkesi olarak açıklanmakta ve bir ülkenin nüfusunun %20si, servetin veya gelirin %80ine sahip olduğu bu şekilde ifade edilmektedir.
Tek hisse senedi için standardize edilmiş fiyat getirileri dağılımı.
İçinde çok büyük sayıda sözcük bulunan ve bazı sözcükler çok tekrarlanırken diğer sözcüklerin nadir olarak kullanıldığı uzun metinlerde sözcük uzunluğu dağılımı.
Değişik dillerde ve ülkelerde insanlara verilmiş olan isimlerin çokluluk dağılımları.
TCP protokolunu kullanan İnternet trafiği için dosya büyüklüğü dağılımı.
Mutlak sıfır yakınında Bose-Einstein yoğunlaşmaları grupları.
Kum parçacıklarının büyüklük dağılımları.
Metoritlerin büyüklük dağılımları.
Orman yangınlarında yanan alanların yüzölçüm dağılımları.

Özellikler

Tanınım

Eğer X bir Pareto dağılım gösteren rassal değişken ise, Xin olasılığının değerini herhangi bir reel sayı olan xden daha büyük olması, yani tüm x ≥ xm için, şu ifade ile verilir:

http://upload.wikimedia.org/math/8/5/a/85ae15eed3c8d654c2dbc2ccfb91f4a1.png

Burada xm mutlaka X için verilen en küçük sayı değeri ve k ise pozitif değerde bir parametredir.
Pareto dağılımları ailesinin tanınmalanması için iki tane sayısal parametre gerekmektedir:
xm ve k. Pareto dağılımı iktisatda servet veya gelir dağılımı modelinde kullanildigi zaman k parametresi Pareto endeksi olarak adlandırılır.

Olasılık yoğunluk fonksiyonu

Bu tanınımdan hemen şu Pareto dağılımı için olasılık yoğunluk fonksiyonu ortaya çıkartılır:

http://upload.wikimedia.org/math/4/5/7/457b4663cfc0e35cf14d685ff55f34de.png

Diğer özellikler



Pareto dağılımı gösteren bir rassal değişken için beklenen değer şöyle ifade edilir:

http://upload.wikimedia.org/math/8/7/6/876b26a54f419db72105d577dd8808b4.png Eğer k ≤ 1 ise beklenen değer sonsuz olacaktır.


Varyans şöyle ifade edilir:

http://upload.wikimedia.org/math/8/b/8/8b81513a2ec6087e2f37540ff0105da6.png Eğer http://upload.wikimedia.org/math/8/9/7/897297ea63399e327632a77e9613e248.png ise, varyans sonsuzdur.


Ham momentler şöyle verilir:

http://upload.wikimedia.org/math/a/8/3/a83876ac0eea69773f59c16285f3b9ce.png Ancak bu momentler sadece k > n icin anlamlıdır.


Bu demektir ki, katsayıları x ile μn' / n! olan bir Taylor serisi şeklinde tanımlanan moment üreten fonksiyon tanımlanmamıştır.
Karakteristik fonksiyonu şöyle verilir:

http://upload.wikimedia.org/math/8/6/2/862d668ac2131689efe0f41e8f214918.png Burada Γ(a,x) bir tamamalanmamış Gamma fonksiyonu olur.


Pareto dağılımının bir üstel dağılım ile şu şekilde ilişkisi bulunur:

http://upload.wikimedia.org/math/6/7/4/674ed47ffec86e3d8e0c93f5ea101e3a.png

Dirac delta fonksiyonu Pareto dağılımının bir limit halidir.

http://upload.wikimedia.org/math/1/f/5/1f53a2a555de2daca6666ef1dc75f3aa.png

Bir karakterizasyon teoremi

Bağımsız ve hepsi aynı dağılımlı rassal değiskenler olan Xi, i = 1, 2, 3, ... in k > 0 değerleri için [k, ∞) aralığında desteklenen olasılık dağılımları bulunduğu kabul edilsin. Ayrıca, tüm n değerleri için şu iki rassal değişken olan
min{ X1, ..., Xn } ve (X1 + ... + Xn)/min{ X1, ..., Xn } birbirinden bağımsız değişkenler oldukları varsayılsın.
Bu halde her iki değişken de Pareto dağılım gösterir.

Zipf'in yasası ile ilişki

Pareto dağılımı sürekli olasılık dağılımdır. Zipf'in yasası veya diğer adı ile zeta dağılımı sürekli Pareto dağılımının araklıklı dağılım karşılığıdır.

Pareto, Lorenz ve Gini

http://upload.wikimedia.org/wikipedia/commons/thumb/5/5c/Pareto_distributionLorenz.png/325px-Pareto_distributionLorenz.png

Birkaç Pareto dağılımı için Lorenz eğrileri.
k = ∞ kusursuzca eşit dağılımı gösterir (G = 0) ve k = 1 doğrusu
ise tüm olarak eşitsiz dağılım gösterimidir (G = 1)

Lorenz egrisi gosterimi cok kere servet veya gelir dagilimini karakterize etmek icin kullanilir.Herhagibir gelri veya servet dagilimi icin Lorenz egrisi L(F) olarak ifade edilip ya bir olasilik yogunluk fonksiyonu olan (f(x)) veya yigimli dagilim fonksiyonu olan (F(x)) ile soyle ifade edilebilir:

http://upload.wikimedia.org/math/e/5/a/e5a80f903eb9fec0d27da491696c482d.png

Burada x(F) yigimli dagilim fonksiyonunun tersidir.
Su Pareto dagilimi icin

http://upload.wikimedia.org/math/8/b/9/8b97e7aba8569741fa3fd8164c15cd8d.png

Lorenz egrisi soyle hesaplanabilir:

http://upload.wikimedia.org/math/2/2/8/2288c86aaf59e076b53fb34dffb233bc.png

L(F) ifadesinin paydasi x in ortalama degeri oldugu icin, k degeri 1'e esit veya 1den buyuk olmalidir. Birkac Pareto dagilimi ile iliskili Lorenz egrileri yukaridaki gosterimde gorulebilir.
Gini katsayisi Lorenz egrisi ile dagilimda-esitlik ifade eden [0,0] ile [1,1] noktalarini bagliyan capraz dogru arasindaki farki, yani esitlikten sapmayi, olcen bir katsayidir. Ozellikle gosterilmistir ki, Gini katsayisi, Lorenz egrisi ile dagilimda-esitlik dogrusu arasindaki alanin yuzolcumunun iki mislidir. .
Bu halde Pareto dagilimi icin Gini katsayisi soyle hesaplanir:

http://upload.wikimedia.org/math/9/9/3/9934eb6c800098a033f92c0e9c360820.png

Parametre kestirimi

Verilmis bir rastgele orneklem veri dizisi olan http://upload.wikimedia.org/math/1/e/f/1ef67edd2e3c85c43fb856285d944154.png icin k ve xm parametreli Paretoi dagilimi icin olabilirlilik fonksiyonu soyle verilir:

http://upload.wikimedia.org/math/c/0/f/c0f0f131a92ffae56b54e3b27f5b0307.png

Böylece logaritmik olabilirlilik fonskiyonu su olur:

http://upload.wikimedia.org/math/d/4/4/d4454d3e513b8bd531cf87d9fe1b7870.png

Bu fonksiyondan gorulmektedir ki http://upload.wikimedia.org/math/8/b/d/8bdf226643d9aa43dd7a849dccd90e80.png terimi xm ile monotonik artis gostermektedir. Yani xm degeri ne kadar buyuk olursa olabilirlilik fonksiyonun degeri de oylece buyuk olacaktir. http://upload.wikimedia.org/math/e/3/0/e30710eeccf953a4749460f6c831f24a.png oldugu icin sonuc olarak

http://upload.wikimedia.org/math/3/9/d/39d87576237b8024ec84ef96bf7f99d5.png cikartilmaktadir.

k icin bir kestrimci bulmak icin, bunun gerekli kismi turevini almak; yani

http://upload.wikimedia.org/math/0/9/d/09d112bb3078ab64e72e3102cf907a7c.png

ve bunun nerede ifira esit oldugunu bulmak gereklidir. Boylece, k icin maksimum olabilirlilik kestirimi su olur:

http://upload.wikimedia.org/math/3/d/2/3d2be3057072947a6f9e6c04df4062ac.png

Bunun beklenen istatistiksel hatasi soyle ifade edilir:

http://upload.wikimedia.org/math/1/4/5/145b5c8fd9aa4337d74d67d20f5c9d18.png [3]

Grafik olarak gösterim

Pareto dağılımı için dogrusal ölçek kullanılarak elde edilen gösterimdeki eğrinin genel olarak ortaya çıkartığı uzun kuyruk özelliği, ayni veri dizisi logaritma-logaritma ölçekli bir grafikte gösterilince ortadan kalkmakta ve negatif eğim gösteren bir doğru ortaya çıkmaktadır.

Pareto dağılımı simulasyonu

Pareto olasilik dagilimi simulasyonu icin bircok komputer istatistik paketinden yardim gorme imkâni su anda bulunmamaktadir. Oysaki Pareto dagilimi ozellikle aktureya hesaplari icin, ozellikle portfoy maliyetlerinin hesaplamasi icin, cok sik olarak kullanilmasi gerekmektedir ve bu hesaplar icin istatistik paketleri ozel Pareto dagilimi simulasyonlari vermemektedirler.
Diger taraftan istatistik paketlerinin verdikleri bazi ozel olasilik dagilimi simulasyonlarini birbirine ekliyerek Pareto dagilimi gosteren rassal degisken simulasyon sonuclari cikartmak zor degildir. Bu surec kolayca basarilmasi icik yordam soyle verilebilir:
Birinci sekilde bir gamma dagilimi tarafinda uretilen bir rastgele orneklem icin bulunan λ ile bir ustel dagilimdan rasgele sayilar ortaya cikartilir; yani

http://upload.wikimedia.org/math/c/8/d/c8d22b9f62aa3e71a6907ecb4dd96594.png ve
http://upload.wikimedia.org/math/c/b/6/cb681c5c9f1306efc8ffa578a5984e68.png

Bu hesaplar 0da baslayan bir rasgele veri serisi uretirler. Bunun ustune xm eklemek gerekir.
Diger bir sekilde simulasyon, ters donusum orneklem alma islemi kullanilarak elde edilir. (0;1) birim araklita bulunan surekli tekduze dagilimdan U degisebiliri icin rastgele olarak elde edilir. Bu degisebilir icin

http://upload.wikimedia.org/math/f/2/b/f2bda9f10ccb29f297fa687cf0e1037f.png

fonksiyonu Pareto-dagilimi gosterir.

Olasılık yoğunluk fonksiyonu


http://upload.wikimedia.org/wikipedia/commons/thumb/d/d9/Pareto_distributionPDF.png/325px-Pareto_distributionPDF.png

xm = 1 oldugu halde çeşitli k değerleri icin Pareto
olasılık yoğunluk fonksiyonları. Yatay eksen x parametredir.
Limitte k → ∞, dağılım δ(x − xm) yaklaşır;
burada δ Dirac delta fonksiyonudur.

Yığmalı dağılım fonksiyonu

http://upload.wikimedia.org/wikipedia/commons/thumb/e/e6/Pareto_distributionCDF.png/325px-Pareto_distributionCDF.png

xm = 1 oldugu halde çeşitli k değerleri icin Pareto yığmalı dağılım fonksiyonları. Yatay eksen x parametredir.