Minggu, 19 Desember 2010

Uji Hipotesis

Bagi yang suka penelitian2 gitu,,, nech ada tentang uji hipotesis,,, semoga bisa membantu ya..... good luck!!!!!! GBU
dali.staff.gunadarma.ac.id/Publications/files/199/4475-a.doc

Post-Hoc-Test Metode Tukey

Dalam pengujian ANOVA, kita dapat menarik kesimpulan apakah menerima atau menolak hipotesis. Jika kita menolak hipotesis, artinya bahwa dari variabel-variabel yang kita uji, terdapat perbedaan yang signifikan. Misalnya jika kita menguji perbedaan 4 metode mengajar terhadap prestasi siswa, kita bisa menyimpulkan bahwa ada perbedaan dari keempat metode tersebut. Akan tetapi, kita tidak mengetahui, metode manakah yang berbeda dari keempatnya. Secara statistik,kita tidak bisa mengatakan bahwa yang terbaik hanya dengan memperhatikan rata-rata dari setiap metode tersebut.

Untuk menjawab pertanyaan metode manakah yang berbeda, maka statistic memiliki teknik post hoc test untuk mengetahui, variabel manakah yang memiliki perbedaan yang signifikan. Ada banyak metode yang ada. Di SPSS ada banyak teknik post hoc. Diantaranya jika asumsi homogenitas varian terpenuhi, maka teknik yang bisa dipergunakan adalah: LSD (least square differences), Tukey, Bonferoni, Duncan, scheffe dan lain sebagainya. Dan jika tidak ada asumsi homogenitas varian, maka teknik yang bisa dipergunakan adalah tamhane T2, dunnett’s T3, games-howell dan dunnett’s C.

Jika jumlah n setiap variabel sama, maka teknik yang bisa digunakan adalah LSD, student Newman-Keuls (SNK) dan Tukey. Akan tetapi jika jumlah n tiap variabel tidak sama, maka kita bisa menggunakan teknik scheffe. Untuk membicarakan setiap teknik itu, akan sangat membutuhkan waktu yang lama. Karena itu pada kesempatan ini saya hanya akan membahas salah satu teknik saja secara manual yaitu teknik Tukey.

Teknik Tukey juga biasa disebut dengan HSD (honestly Significant difference). Untuk melakukan teknik ini, kita memerlukan salah satu test statistic yaitu Q yang dianalogikan dari statistik-t yang didefinisikan secara matematis:

Sekarang kita lihat bagaimana cara menggunakan teknik ini. Misalnya kita memiliki empat metode yang kita uji untuk melihat apakah ada perbedaan metode serta jika ada, manakah di antara keempat metode tersebut yang berbeda secara signifikan.

dari data tersebut, kita bisa membuat rangkuman analisis varian seperti berikut ini:

berdasarkan table tersebut, kita dapat menyimpulkan bahwa H0 di tolak sehingga kita bisa mengatakan ada perbedaan yang signifikan dari keempat metode yang di pergunakan. Pertanyaan selanjutnya adalah metode manakah yang berbeda? Untuk menjawabnya kita memerlukan teknik tukey.

Langkah pertama yang kita lakukan adalah kita membuat matriks korelasi dari rata-rata setiap variabel seperti ini:


Matriks dibuat mulai dari metode yang memiliki rata-rata terkecil. Langkah selanjutnya adalah mencari perbedaan setiap metode. Misalnya antara metode 2 dan metode 4 memiliki perbedaan: 12,4 – 8,4 = 4, antara metode 2 dan 1 memiliki perbedaan 13,6 – 8,4 = 5,2 dan seterusnya.

Langkah berikutnya adalah mencari nilai Q dengan membagi perbedaan mean antara masing-masing metode dengan


nilai Mean Square Within (MSW) diperoleh dari rangkuman table ANAVA). Dengan demikian,

Sebagai contoh 4,00/1,19 = 3,36, 5,20/1,19 = 4,37. Untuk lebih jelasnya, saya rangkumkan dalam table berikut ini:

Dengan memperhatikan nilai Q dibandingkan dengan nilai r table, dimana r adalah jumlah means. Dalam kasus ini, jumlah kolom adalah 4. Adapun derajad kebebasan adalah 16. Jumlah 16 merupakan n – k = 20 -4 = 16. Dengan demikian, nilai kritis untuk Q adalah 4,05 dan 5,19 untuk tingkat kepercayaan 0,05 dan 0,01. Dengan demikian, nilai Q yang berada di atas nilai Q kritis hanyalah antara metode 1 dan 2 serta 1,3 pada tingkat kepercayaan 0,05 serta metode 1 dan 3 pada tingkat kepercayaan 0,01.

Selasa, 14 Desember 2010

One Sample Test

Nech ada visual nya untuk one sample test dilihat ya....

Skewness dan kurtosis

Skewness dan Kurtosis

Sebelum dilakukan pemodelan, ada baiknya data return diuji terlebih dahulu apakah memenuhi asumsi ini ataukah tidak, sehingga pemodelan yang dilakukan akan lebih valid. Ada banyak cara untuk menguji normalitas data, baik yang bersifat eksploratif (deskriptif) maupun konfirmatif (inferensi). Salah satu cara yang bersifat eksploratif adalah dengan melihat bentuk kurva pendekatan distribusi empirisnya, yaitu dengan menghitung nilai skewness (kemencengan) dan kurtosis (keruncingan) kemudian membandingkan dengan distribusi normal.
Skewness adalah derajat ketidaksimetrisan suatu distribusi. Jika kurva frekuensi suatu distribusi memiliki ekor yang lebih memanjang ke kanan (dilihat dari meannya) maka dikatakan menceng kanan (positif) dan jika sebaliknya maka menceng kiri (negatif). Secara perhitungan, skewness adalah momen ketiga terhadap mean. Distribusi normal (dan distribusi simetris lainnya, misalnya distribusi t atau Cauchy) memiliki skewness 0 (nol).
Kurtosis adalah derajat keruncingan suatu distribusi (biasanya diukur relatif terhadap distribusi normal). Kurva yang lebih lebih runcing dari distribusi normal dinamakan leptokurtik, yang lebih datar platikurtik dan distribusi normal disebut mesokurtik. Kurtosis dihitung dari momen keempat terhadap mean. Distribusi normal memiliki kurtosis = 3, sementara distribusi yang leptokurtik biasanya kurtosisnya > 3 dan platikurtik <>


dengan :



Untuk memberikan gambaran visual, berikut ini diberikan ilustrasi Skewness (Gambar 1) dan Kurtosis (Gambar 2) :




Gambar 1

UJI HIPOTESIS

yang berminat pada salah satu pembahasan dunia statistik dalam hal uji hipotesis,,, silahkan klik link ini untuk belajar lebih lanjut.... thx

http://www.scribd.com/doc/24061543/Uji-Hipotesis

Distribusi Poisson

Ayo kita sama sama belajar distribusi poisson... Nech aku sekedar membantu dengan beberapa materi yang ada,,,,, silahkan mencoba dan mempelajari,,,, majukan dunia dengan penelitian data statistik.... Yeahhhhh!!!!!! GBU allllll

MODUL DISTRIBUSI POISSON


  1. Pendahuluan

Distribusi Poisson diberi nama sesuai dengan penemunya yaitu Siemon D. Poisson. Distibusi ini merupakan distribusi probabilitas untuk variabel diskrit acak yang mempunyai nilai 0,1, 2, 3 dst. Suatu bentuk dari distribusi ini adalah rumus pendekatan peluang Poisson untuk peluang Binomial yang dapat digunakan untuk pendekatan probabilitas Binomial dalam situasi tertentu.

Rumus Poisson dapat digunakan untuk menghitung probabilitas dari jumlah kedatangan, misalnya : probabilitas jumlah kedatangan nasabah pada suatu bank pada jam kantor. Distribusi Poisson ini digunakan untuk menghitung probabilitas menurut satuan waktu.


Rumus Pendekatan Peluang Poisson untuk Binomial

Pendekatan Peluang Poisson untuk Peluang Binomial dilakukan untuk mendekatkan probabilitas probabilitas dari kelas sukses (x) dari n percobaan Binomial dalam situasi dimana n sangat besar dan probabilitas kelas sukses (p) sangat kecil. Aturan yang diikuti oleh kebanyakan ahli statistika adalah bahwa n cukup besar dan p cukup kecil, jika n adalah 20 atau lebih dari 20 dan p adalah 0.05 atau kurang dari 0.05. Pada pendekatan ini rumusnya lebih mudah untuk digunakan dibandingkan dengan rumus Binomial.

Rumus pendekatannya adalah :

P ( x ; μ ) = e μ . μ X

X ! Dimana : e = 2.71828

μ = rata – ratakeberhasilan = n . p

x = Banyaknya unsur berhasil dalam sampel

n = Jumlah / ukuran populasi

p = probabilitas kelas sukses





Contoh soal :

  1. Dua ratus penumpang telah memesan tiket untuk sebuah penerbangan luar negeri. Jika probabilitas penumpang yang telah mempunyai tiket tidak akan datang adalah 0.01 maka berapakah peluang ada 3 orang yang tidak datang.

  2. Rata – rata seorang sekretaris baru melakukan lima kesalahan mengetik per halaman. Berapakah peluang bahwa pada halaman berikut ia :

    1. Tidak ada kesalahan ( x = 0 )

    2. Tidak lebih dari tiga kesalahan ( x ≤ 3) atau ( 0,1,2,3 )

    3. Lebih dari tiga kesalahan ( x > 3 ) atau ( 4,…,15)

Jawab :

  1. Dik : n = 200, P = 0.01, X = 3, μ = n . p = 200 . 0.01 = 2

P ( x ; μ ) = e μ . μ X

X!

= 2.71828 – 2 . 2 3 = 0.1804 atau 18.04 %

3!

2. Dik : μ = 5

a. x = 0 P ( x ; μ ) = e μ . μ X

X!

P ( 0 ; 5 ) = 2.71828 – 5 . 5 0 = 0.0067

0!

b. x ≤ 3 ; P ( x ; μ ) = e μ . μ X

X!

P (x ≤ 3 , 5) = P( x 1, μ ) +….+p(x3, μ)

= P( 0, 5 ) + P (1, 5 ) + P ( 2, 5 ) + P ( 3, 5 )

= 0.0067 + 0.0337 + 0.0842 + 0.1404

= 0.2650 atau 26.5 %

c. X > 3 ; P ( x ; μ ) = e μ . μ X

X!

P (X > 3 , 5) = P( X 4, μ ) +….+p(X 15, μ)

= P( 4, 5 ) + P (5, 5 ) + …… + P ( 15, 5 ) atau


P (X > 3 , 5) = 1 – [P ( X ≤ 3 , 5 ) ]

= 1 – [ P ( X 0, μ ) +….+ p (X 3, μ) ]

= 1 – [ P ( 0, 5 ) +….+p ( 3, 5 ) ]

= 1 – [ 0.2650 ]

= 73.5 %

Rumus Proses Poisson

Distribusi Poisson dalam konteks yang lebih luas dari pada rumus pertama tadi. Sebagai ilustrasi, misalkan pada hari Senin ini adalah jam kerja yang sibuk pada suatu bank, dan kita tertarik oleh jumlah nasabah yang mungkin datang selama jam kerja tersebut, dengan ketertarikan kita sebenarnya terletak pada interval waktu dan jumlah kedatangan dalam interval waktu jika proses kedatangannya mempunyai karakteristik sebagai berikut:

  1. Tingkat kedatangan rata – rata setiap unit waktu adalah konstant.

Dalam ilustrasi tadi dapat berarti bahwa jika tingkat kedatangan rata – rata untuk periode jam adalah, misalkan 72 kedatangan setiap jam, maka tingkat ini melambangkan interval waktu pada jam kerja tadi : yaitu tingkat yang dapat dirubah kepada rata – rata yaitu 36 kedatangan setiap ½ jam atau 1.2 kedatangan setiap menit.

  1. Jumlah kedatangan pada interval waktu tidak bergantung pada ( bebas apa yang terjadi di interval waktu yang sudah lewat. Dalam ilustrasi tadi, dapat berarti bahwa kesempatan dari sebuah kedatangan di menit berikutnya adalah sama.

  2. Tidak memiliki kesamaan bahwa akan lebih dari satu kedatangan dalam interval pendek, semakin pendek interval, semakin mendekati nol adalah probabilitas yang lebih dari satu kedatangan. Dalam ilustrasi tadi, bisa berarti bahwa adalah tidak mungkin untuk lebih dari satu nasabah yang dapat melawati jalan masuk dalam waktu satu detik.


Rumus proses poisson :

P ( x ) = e λ . t . ( λ . t ) x

X! Dimana :λ = Tingkat rata – rata kedatangan tiap unit waktu

t = Jumlah unit waktu

x = Jumlah kedatangan dalam t unit waktu


Contoh soal :

Jika rata – rata kedatangan λ = 72 setiap jam, berapakah peluang dari x = 4 kedatangan dan t = 3 menit. Gunakan proses poisson.!

Jawab :

Dik : λ = 72 kedatangan setiap jam atau 72 / jam maka 1 jam atau 60 menit adalah unit waktunya. Berarti 3 menit adalah 3 / 60 = 1 / 20 unit waktu maka t t = 1 / 20 dan x = 4


P ( x ) = e λ . t . ( λ . t ) x

X!

P ( x ) = e –72 . ( 1/ 20 ) . ( 72 . 1 / 20 ) 4

4!

= 0.191 atau 19.1 %

Distribusi binomial

Bagi yang mau belajar tentang distribusi normal dan berkaitan dengan distribusi binomial aku punya link nya nech,,, silahkan di buka dan di coba.....
Jadikan penghitungan statistik menjadi lebih menyenangkan..... SEMANGAT!!!!

staff.blog.ui.ac.id/onggo.wiryawan/files/2010/03/2-distribusi-binomial.pdf

Normal probability

Penghitungan standar deviasi dan mean

Apa aja sech yang di bahas oleh ilmu statistik??

PEMBAGIAN ILMU STATISTIK


Ilmu statistika secara garis besar dibagi menjadi 2:…..

  1. Statistika parametrik -> ilmu statistika yang mempertimbangkan jenis sebaran/distribusi data, yaitu apakah data menyebar normal atau tidak. Pada umumnya, Jika data tidak menyebar normal, maka data harus dikerjakan dengan metode Statistika non-parametrik, atau setidak2nya dilakukan transformasi agar data mengikuti sebaran normal, sehingga bisa dikerjakan dg statistika parametrik. Contoh metode statistika parametrik: uji-z (1 atau 2 sampel), uji-t (1 atau 2 sampel), korelasi pearson, Perancangan Percobaan (1 or 2-way ANOVA parametrik), dll.
  2. Statistika non-parametrik -> Menurut literatur yang ditulis dosen saya (Bu Ani), statistika non-parametrik adalah statistika bebas sebaran (tdk mensyaratkan bentuk sebaran parameter populasi, baik normal atau tidak). Statistika non-parametrik biasanya digunakan untuk melakukan analisis pada data berjenis Nominal atau Ordinal. Data berjenis Nominal dan Ordinal tidak menyebar normal. Contoh metode Statistika non-parametrik:Binomial test, Chi-square test, Median test, Friedman Test, dll.


Parametrik

Parametrik mengandung pengertian parameter, yaitu indikator dari suatu distribusi hasil pengukuran. Indikator dari distribusi pengukuran berdasarkan statistik parametrik digunakan untuk menjadi parameter dari distribusi normal.

Distribusi normal, atau dikenal juga dengan istilah Gaussian Distribution, mengandung dua parameter, yaitu mean (m) dan varians (s2). Parameter-parameter ini memberikan karakteristik yang unik pada suatu distribusi berdasarkan "lokasi"-nya (central tendency), dan sebagai metode statistik, mendasarkan perhitungannya juga pada kedua parameter tersebut.


Dari penjelasan singkat ini tampak bahwa penggunaan metode statistik parametrik mengikuti prinsip-prinsip distribusi normal (lihat di wikipedia untuk penjelasan lebih lanjut).

Konsekuensi dari pengertian ini, maka penerapan statistik parametrik perlu memperhatikan hal-hal berikut.

  • Distribusi dari suatu sampel yang dijadikan obyek pengukuran berasal dari distribusi populasi yang bisa diasumsikan terdistribusi secara normal.
  • Sampel diperoleh secara random, dengan jumlah yang dianggap dapat mewakili populasi.
  • Distribusi normal merupakan bagian dari continuous probability distribution, sehingga skala pengukurannya pun haruslah kontinyu (rasio atau interval) atau skala nominal yang diubah menjadi proporsi (hanya bisa diolah menggunakan chi-square).

Bila syarat-syarat ini semua terpenuhi, maka baru dapat diterapkan metode statistik parametrik.


Nonparametrik

Istilah nonparametrik sendiri pertama kali digunakan oleh Wolfowitz, 1942. Istilah lain yang sering digunakan antara lain distribution-free statistics dan assumption-free test. Dari istilah-istilah ini, dengan mudah terlihat bahwa metode statistik nonparametrik merupakan metode statistik yang dapat digunakan dengan mengabaikan segala asumsi yang melandasi metode statistik parametrik, terutama yang berkaitan dengan distribusi normal.

Kapan digunakan metode statistik nonparametrik? Dari pengertian sebelumnya, dengan sederhana dapat dikatakan metode pengujian ini digunakan bila salah satu parameter statistik parametrik tidak terpenuhi (lihat bagan alur berikut).


Dalam perkembangan psikologi sebagai ilmu, dalam masa yang sangat panjang, bahkan sampai hari ini, psikologi berusaha agar dapat dipandang sebagai pendekatan yang ilmiah. Dalam atmosfer positivistik, salah satu usaha untuk menjadi lebih ilmiah adalah dengan melakukan pengukuran. Artinya, kualitas-kualitas psikologis manusia dicoba untuk diberikan atribut berupa angka, untuk kemudian diolah secara matematis / statistik.

Namun tidak semua kondisi dalam pengukuran psikologi ideal untuk diterapkan pada semua teknik statistik, seperti:

  • banyak aspek psikologis yang sulit dikuantifisir ke dalam skala pengukuran interval apalagi rasio (sulit untuk mengatakan, misalnya, sikap terhadap minuman beralkohol seseorang / sekelompok orang dua kali lebih tinggi dibandingkan orang / kelompok lain);
  • sulit mengasumsikan bahwa variabel psikologis tertentu terdistribusi secara normal.

Oleh karena itu, metode statistik nonparametrik dianggap dapat lebih menjawab kebutuhan dan sesuai dengan kondisi dalam ilmu piskologi.

Namun sebelum membahas tentang metode statistik nonparametrik, terlebih dahulu perlu dipahami tentang apa itu parametrik.

Parametrik

Parametrik mengandung pengertian parameter, yaitu indikator dari suatu distribusi hasil pengukuran. Indikator dari distribusi pengukuran berdasarkan statistik parametrik digunakan untuk menjadi parameter dari distribusi normal.

Distribusi normal, atau dikenal juga dengan istilah Gaussian Distribution, mengandung dua parameter, yaitu mean (m) dan varians (s2). Parameter-parameter ini memberikan karakteristik yang unik pada suatu distribusi berdasarkan "lokasi"-nya (central tendency), dan sebagai metode statistik, mendasarkan perhitungannya juga pada kedua parameter tersebut.

Dari penjelasan singkat ini tampak bahwa penggunaan metode statistik parametrik mengikuti prinsip-prinsip distribusi normal (lihat di wikipedia untuk penjelasan lebih lanjut).

Konsekuensi dari pengertian ini, maka penerapan statistik parametrik perlu memperhatikan hal-hal berikut.

  • Distribusi dari suatu sampel yang dijadikan obyek pengukuran berasal dari distribusi populasi yang bisa diasumsikan terdistribusi secara normal.
  • Sampel diperoleh secara random, dengan jumlah yang dianggap dapat mewakili populasi.
  • Distribusi normal merupakan bagian dari continuous probability distribution, sehingga skala pengukurannya pun haruslah kontinyu (rasio atau interval) atau skala nominal yang diubah menjadi proporsi (hanya bisa diolah menggunakan chi-square).

Bila syarat-syarat ini semua terpenuhi, maka baru dapat diterapkan metode statistik parametrik.

Nonparametrik

Istilah nonparametrik sendiri pertama kali digunakan oleh Wolfowitz, 1942. Istilah lain yang sering digunakan antara lain distribution-free statistics dan assumption-free test. Dari istilah-istilah ini, dengan mudah terlihat bahwa metode statistik nonparametrik merupakan metode statistik yang dapat digunakan dengan mengabaikan segala asumsi yang melandasi metode statistik parametrik, terutama yang berkaitan dengan distribusi normal.

Kapan digunakan metode statistik nonparametrik? Dari pengertian sebelumnya, dengan sederhana dapat dikatakan metode pengujian ini digunakan bila salah satu parameter statistik parametrik tidak terpenuhi (lihat bagan alur berikut).


Teknik statistik nonparametrik

Ada banyak teknik statistik pada metode nonparametrik.

Untuk menentukan teknik statistik yang tepat, secara sederhana dapat dilakukan dengan menjawab pertanyaan-pertanyaan berikut:

  • Apa tujuan pengujian tersebut? [menggambarkan, menguji perbedaan, korelasi, dan sebagainya]
  • Bila untuk menguji perbedaan, ada berapa kelompok sampel yang akan diuji? [satu, dua, atau lebih dari dua]
  • Bila untuk menguji perbedaan, apakah kelompok berasal dari satu populasi yang sama (atau dapat dibuat berpasangan), atau kelompok-kelompok yang saling independen?
  • Apa skala pengukurannya? [nominal atau ordinal]

Pertanyaan-pertanyaan ini adalah pertanyaan dasar untuk menentukan teknik statistik nonparametrik yang sesuai dengan kebutuhan dan kondisi data. Namun untuk tingkatan yang lebih lanjut, perlu diperhatikan juga power dari masing-masing teknik, disesuaikan dengan kondisi data yang lebih spesifik.

Isi tabel berikut adalah beberapa teknik statistik nonparametrik yang lazim digunakan, dengan membandingkan dengan teknik statistik parametrik.

TUJUAN

JENIS DATA


Pengukuran dari populasi Gaussian

Skala ordinal atau pengukuran Non Gaussian

Binomial

Deskripsi satu kelompok

Mean, SD

Median, interquartile range

Proportion

Membandingkan satu kelompok dengan nilai hipotetis

One-sample t test

Wilcoxon test

Chi-square
atau
Binomial test

Membandingkan dua kelompok tidak berpasangan

Unpaired t test

Mann-Whitney test

Fisher's test
(chi-square untuk sampel besar)

Membandingkan dua kelompok berpasangan

Paired t test

Wilcoxon test

McNemar's test

Membandingkan lebih dari dua kelompok tidak berpasangan

One-way ANOVA

Kruskal-Wallis test

Chi-square test

Membandingkan lebih dari dua kelompok berpasangan

Repeated-measures ANOVA

Friedman test

Cochrane Q

Korelasi

Pearson correlation

Spearman correlation

Contingency coefficients

Prediksi dengan pengukuran variabel lain

Simple linear regression
or
Nonlinear regression

Nonparametric regression

Simple logistic regression

Prediksi dari beberapa pengukuran atau variabel binomial

Multiple linear regression
or
Multiple nonlinear regression


Multiple logistic regression

Apa itu statistik??

Secara etimologis kata "statistik" berasal dari kata status (bahasa latin) yang mempunyai persamaan arti dengan kata state (bahasa Inggris) atau kata staat (bahasa Belanda), dan yang dalam bahasa Indonesia diterjemahkan menjadi negara. Pada mulanya, kata "statistik" diartika sebagai "kumpulan bahan keterangan (data), baik yang berwujud angka (data kuantitatif) maupun yang tidak berwujud angka (data kualitatif), yang mempunyai arti penting dan kegunaan yang besar bagi suatu negara. Namun, pada perkembangan selanjutnya, arti kata statistik hanya dibatasi pada "kumpulan bahan keterangan yang berwujud angka (data kuantitatif)" saja; bahan keterangan yang tidak berwujud angka (data kualitatif) tidak lagi disebut statistik.

dalam kamus bahasa Inggris akan kita jumpai kata statistics dan kata statistic. Kedua kata itu mempunyai arti yang berbeda. Kata statistics artinya "ilmu statistik", sedang kata statistic diartika sebagai "ukuran yang diperoleh atau berasal dari sampel," yaitu sebagai lawan dari kata "parameter" yang berarti "ukuran yang diperoleh atau berasal dari populasi".