Walaupun lengkung kelihatan sama, apakah perbezaan antara taburan Cauchy dan Gaussian?


Jawapan 1:

Cauchy tidak kelihatan seperti biasa. Betapa betul-betul kelihatan Cauchy bergantung kepada parameter yang anda gunakan, tetapi ia tidak kelihatan normal.

contohnya

set.seed (1234) #Beberapa benih nombor rawak x1 <- rnorm (1000, min (x1), sd (x1)) plot (ketumpatan (x1)) plot (kepadatan (x2))

Jangan melihat sama sama sekali. Dan x1 berkisar dari -178 hingga 702 sementara x2 bergerak dari -76 hingga 71.


Jawapan 2:

Seperti yang anda dapat lihat, kedua-dua lengkung kelihatan sama dengan kedua-duanya mempunyai satu "bonggol" tunggal dan menyebarkan lebih kecil lagi yang anda dapat. Mereka berbeza kerana Cauchy mempunyai puncak sempit dan menyebar lebih perlahan - terdapat kebarangkalian yang jauh lebih besar untuk memperoleh nilai jauh dari puncak berbanding dengan taburan normal. Perbezaan ini menghasilkan banyak akibat yang berbeza secara matematik - seperti Cauchy yang tidak mempunyai nilai min yang jelas dan mempunyai taburan pensampelan yang aneh di mana "undang-undang nombor besar" tidak terpakai.


Jawapan 3:

Walaupun lengkung kelihatan sama, apakah perbezaan antara taburan Cauchy dan Gaussian?

Secara duniawi, mereka kelihatan sama. Tetapi tunjukkan kepada saya grafik fungsi ketumpatan pengedaran dan beritahu saya ia sama ada Cauchy atau Gaussian, saya akan tahu yang mana (dengan anggapan ia benar-benar adalah salah satu daripadanya). Cauchy mempunyai ekor yang lebih panjang.

Apabila kita mempunyai keluarga pengedaran dengan parameter yang tidak diketahui, kami ingin menganggarkan parameter tersebut.

  • Pengagihan Gaussian mempunyai dua parameter, min dan sisihan piawai. Kita boleh menggunakan parameter lain, contohnya median (yang bersamaan dengan min) dan julat separuh interquartile (iaitu
  • 0.67450.6745
  • kali sisihan piawai). Purata pengedaran Cauchy tidak wujud, tetapi median adalah pusat simetri. Penyimpangan piawai tidak wujud sama ada, tetapi purata penyimpangan kuadrat dari median adalah tak terhingga.

Jadi itulah perbezaan utama. Kita boleh mengambil parameter sama ada pengedaran untuk menjadi median dan separa interquartile, tetapi kita tidak boleh menggunakan sisihan min dan standard untuk Cauchy kerana mereka tidak wujud.

Apabila kita mengambil sampel untuk membantu kita menganggarkan parameter pengedaran, kita menghitung statistik seperti min dan sisihan piawai nilai sampel. Statistik ini mempunyai pengedaran. Pengedaran statistik sampel dikenali sebagai taburan pensampelannya.

  • Jika pengedaran populasi adalah Gaussian, (taburan sampel), min sampel juga Gaussian dan mempunyai sisihan piawai yang lebih kecil, jadi sampel besar memberikan anggaran yang lebih tepat daripada hanya mengambil satu pemerhatian. Jika pengedarannya adalah Cauchy, Maksud sampel juga mempunyai pengedaran Cauchy, tetapi ia mempunyai median dan median separuh interquartile yang sama dengan pengedaran asal. Tidak ada faedah dalam mengambil contoh sampel.

Jadi itu satu lagi perbezaan. Purata sampel dari Gaussian berguna untuk menganggarkan min (atau median); min sampel untuk Cauchy tidak berguna untuk menganggarkan median. Lebih baik menggunakan sampel median, yang memberikan anggaran yang lebih tepat.

Argumen serupa berlaku untuk menganggar penyebaran (namun anda menentukannya) sama ada pengedaran. Anggaran biasa untuk pengagihan Gaussian tidak berfungsi untuk pengedaran Cauchy.

Perbezaan sebenar adalah dalam formula matematik untuk ketumpatan. Dalam bentuk standard Gaussian mempunyai ketumpatan

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

dan Cauchy mempunyai ketumpatan

1π(1+z2)\frac1{\pi(1+z^2)}

.

Perhatikan bahawa kedua-dua

zz

s berbeza. Dalam kes pertama sisihan piawai adalah

11

, dalam kes kedua, kuartil atas adalah

11

.

Fungsi edaran (kebarangkalian itu

ZzZ\le z

) tidak mempunyai bentuk tertutup yang kemas bagi pengagihan Gaussian, tetapi ia berlaku untuk Cauchy, itu

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

Jika anda ingin menggambarkan pengedaran pada paksi yang sama untuk melihat perbezaannya, anda sepadan dengan parameter. Maka saya akan menyeragamkan Gaussian supaya kuartil yang lebih rendah dan atas adalah

0.6745-0.6745

dan

0.67450.6745

, iaitu menjadikan sisihan piawai bersamaan dengan

1.48261.4826

dan gunakan borang standard untuk Cauchy. Kawasan-kawasan di bawah graf mestilah sama, jadi ketinggian di pusat perlu diselaraskan dengan tepat (

0.2690.269

untuk Gaussian dan

0.3180.318

untuk Cauchy-Cauchy lebih tinggi di tengah dan lebih tinggi di ekor).