Mean Median Dan Mode
Analisis statistik di R dilakukan dengan menggunakan banyak fungsi built-in. Sebagian besar fungsi ini adalah bagian dari paket dasar R. Fungsi-fungsi ini mengambil vektor R sebagai masukan bersama dengan argumen dan memberikan hasil. Kali ini kita akan membahasa fungsi mean() , median() dan mode() :
Dalam statistika, kita biasanya menghitung nilai-nilai yang ada dengan menggunakan mean() , median() dan mode()
* Mean – Nilai rata-rata
* Median – Nilai tengah
* Mode – Nilai paling umum
Untuk menghitung nilai rata-rata (mean) variabel dari kumpulan data mtcars, temukan jumlah semua nilai dan bagi jumlahnya dengan jumlah nilai.
Sorted observation of wt (weight)
1.5131.6151.8351.9352.1402.2002.3202.4652.6202.7702.7802.8753.1503.1703.1903.2153.4353.4403.4403.4403.4603.5203.5703.5703.7303.7803.8403.8454.0705.2505.3455.424Sintaks yang digunakan untuk menghitung mean() :
mean(x, trim = 0, na.rm = FALSE, …)
Berikut adalah deskripsi parameter yang digunakan :
* x adalah vektor masukan.
* trim digunakan untuk menghilangkan beberapa pengamatan dari kedua ujung vektor yang diurutkan.
* na.rm digunakan untuk menghilangkan nilai yang hilang dari vektor masukan.
Contoh
Temukan berat rata-rata (wt) sebuah mobil:
Output:
[1] 3. Nilai median adalah nilai di tengah. Nilai paling tengah dalam rangkaian data disebut median. Fungsi median() digunakan di R untuk menghitung nilai ini.
Jika kita melihat nilai variabel wt (dari kumpulan data mtcars), kita akan melihat bahwa ada dua angka di tengah:
Sorted observation of wt (weight)
1.5131.6151.8351.9352.1402.2002.3202.4652.6202.7702.7802.8753.1503.1703.1903.2153.4353.4403.4403.4403.4603.5203.5703.5703.7303.7803.8403.8454.0705.2505.3455.424Catatan: Jika ada dua angka di tengah, maka kita harus membagi jumlah angka-angka itu dengan dua, untuk mencari median.
Sintaks yang digunakan untuk menghitung median() :
median(x, na.rm = FALSE)
Berikut adalah deskripsi parameter yang digunakan :
* x adalah vektor masukan.
* na.rm digunakan untuk menghilangkan nilai yang hilang dari vektor masukan.
Contoh
Temukan nilai titik tengah berat (wt):
Output:
[1] 3.325
Mode adalah nilai yang memiliki jumlah kemunculan tertinggi dalam satu set data. Tidak seperti mean dan median, mode dapat memiliki data numerik dan karakter.
R tidak memiliki fungsi bawaan standar untuk menghitung mode. Jadi kita membuat fungsi pengguna untuk menghitung mode kumpulan data di R. Fungsi ini mengambil vektor sebagai input dan memberikan nilai mode sebagai output. Jadi kita dapat membuat fungsi kita sendiri untuk menemukannya.
Jika kita melihat nilai variabel wt (dari kumpulan data mtcars), kita akan melihat bahwa angka 3.440 sering ditampilkan:
Sorted observation of wt (weight)
1.5131.6151.8351.9352.1402.2002.3202.4652.6202.7702.7802.8753.1503.1703.1903.2153.4353.4403.4403.4403.4603.5203.5703.5703.7303.7803.8403.8454.0705.2505.3455.424Kita tidak akan menghitungnya sendiri, kita akan menggunakan kode berikut untuk menemukan mode:
Contoh
Output:
[1] “3.44”
Dari contoh di atas, kita sekarang tahu bahwa bilangan yang paling sering muncul dalam variabel mtcars wt adalah 3,44 atau 3,440 lbs.