Manipulasi Data menggunakan Python - Learning by Doing

Monday, March 27, 2023

Manipulasi Data menggunakan Python


Untuk melakukan manipulasi data menggunakan Python, pertama-tama kita perlu mengimpor atau memuat library yang diperlukan. Library ini biasanya digunakan untuk membaca, memanipulasi, dan menyimpan data dalam format yang berbeda.
Berikut adalah beberapa langkah umum yang dilakukan dalam manipulasi data menggunakan Python:
  1. Import library: Impor library Pandas;
  2. Membuat dataframe: Buat dataframe dari data mentah yang akan dimanipulasi;
  3. Menampilkan data: Tampilkan data yang dimuat dalam dataframe menggunakan fungsi head();
  4. Menambah kolom baru: Tambahkan kolom baru ke dataframe menggunakan tanda [];
  5. Menghapus kolom: Hapus kolom dari dataframe menggunakan fungsi drop();
  6. Menghitung statistik: Hitung statistik sederhana pada data menggunakan fungsi built-in seperti max(), mean(), dan sum().
Dengan mengikuti langkah-langkah ini, kita dapat melakukan manipulasi data yang diperlukan untuk analisis data selanjutnya.

Untuk contohnya Anda dapat melihat code source dibawah ini:
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
# Import library Pandas
import pandas as pd

# Membuat dataframe (jika Anda sudah punya data, skip bagian ini)
df = pd.DataFrame({
   'nama': ['Ayu', 'Budi', 'Citra', 'Dewi'],
   'usia': [25, 30, 27, 29],
   'kota': ['Jakarta', 'Bandung', 'Surabaya', 'Yogyakarta']
})

# Menampilkan 5 baris pertama
df.head()

# Menambah kolom baru
df['pekerjaan'] = ['Guru', 'Dokter', 'Insinyur', 'Akuntan']
df.head()

# Menghapus kolom 'kota'
df = df.drop('kota', axis=1)
df.head()

# Menampilkan usia maksimum
print(df['usia'].max())

# Menampilkan rata-rata usia
print(df['usia'].mean())

Bagikan artikel ini

No comments:

Post a Comment