Untuk melakukan manipulasi data menggunakan Python, pertama-tama kita perlu mengimpor atau memuat library yang diperlukan. Library ini biasanya digunakan untuk membaca, memanipulasi, dan menyimpan data dalam format yang berbeda.
Berikut adalah beberapa langkah umum yang dilakukan dalam manipulasi data menggunakan Python:
- Import library: Impor library Pandas;
- Membuat dataframe: Buat dataframe dari data mentah yang akan dimanipulasi;
- Menampilkan data: Tampilkan data yang dimuat dalam dataframe menggunakan fungsi head();
- Menambah kolom baru: Tambahkan kolom baru ke dataframe menggunakan tanda [];
- Menghapus kolom: Hapus kolom dari dataframe menggunakan fungsi drop();
- Menghitung statistik: Hitung statistik sederhana pada data menggunakan fungsi built-in seperti max(), mean(), dan sum().
Dengan mengikuti langkah-langkah ini, kita dapat melakukan manipulasi data yang diperlukan untuk analisis data selanjutnya.
Untuk contohnya Anda dapat melihat code source dibawah ini:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 | # Import library Pandas import pandas as pd # Membuat dataframe (jika Anda sudah punya data, skip bagian ini) df = pd.DataFrame({ 'nama': ['Ayu', 'Budi', 'Citra', 'Dewi'], 'usia': [25, 30, 27, 29], 'kota': ['Jakarta', 'Bandung', 'Surabaya', 'Yogyakarta'] }) # Menampilkan 5 baris pertama df.head() # Menambah kolom baru df['pekerjaan'] = ['Guru', 'Dokter', 'Insinyur', 'Akuntan'] df.head() # Menghapus kolom 'kota' df = df.drop('kota', axis=1) df.head() # Menampilkan usia maksimum print(df['usia'].max()) # Menampilkan rata-rata usia print(df['usia'].mean()) |
No comments:
Post a Comment