"Pemberian suplemen zinc selama kehamilan mengurangi risiko kelahiran prematur sebesar 22% (p = 0,03)."
Berita ini menyebar luas di media kesehatan Indonesia. Beberapa RS mulai meresepkan zinc untuk semua ibu hamil.
Tetapi ada yang tidak diceritakan di headline: OR = 0,78 dengan 95% CI: 0,62–0,98. Artinya — efek terkecil yang kompatibel dengan data adalah pengurangan risiko hanya 2%, dan studi ini dilakukan pada populasi dengan defisiensi zinc berat yang mungkin tidak representatif untuk ibu hamil Indonesia secara umum. Jumlah pasien yang perlu diobati (Number Needed to Treat/NNT) untuk mencegah satu kelahiran prematur adalah 47 — dengan biaya yang tidak kecil dan tanpa data tentang efek jangka panjang.
Di saat yang sama, sebuah studi lain melaporkan: "Tidak ada perbedaan signifikan dalam AKI antara kelompok program dan kontrol (p = 0,11)." Apakah ini berarti program tidak efektif? Tidak selalu — p = 0,11 mungkin terjadi karena studi underpowered, bukan karena program tidak bekerja.
Kedua contoh ini menggambarkan masalah yang sama: ketika statistik tidak dipahami dengan benar, ia dapat menyesatkan — baik ke arah over-treatment maupun under-treatment. Kompetensi biostatistik bukan sekadar kemampuan menghitung — ia adalah kemampuan membaca bukti dengan kritis dan menggunakannya untuk pengambilan keputusan klinis dan kebijakan yang tepat.
Modul ini membangun kompetensi biostatistik terapan yang langsung relevan untuk praktik konsultan Obginsos: dari statistik deskriptif dan inferensial dasar, melalui ukuran asosiasi dan dampak, hingga interpretasi hasil penelitian yang dapat dipertanggungjawabkan.
Setelah menyelesaikan modul ini, peserta didik mampu:
Tepat untuk data yang terdistribusi normal (simetris). Sangat sensitif terhadap outlier.
Contoh tepat: Berat lahir bayi aterm (distribusi mendekati normal)
Contoh tidak tepat: Lama rawat inap (sangat right-skewed — beberapa kasus sangat panjang menarik mean ke atas)
Tepat untuk data yang tidak terdistribusi normal (skewed). Tidak sensitif terhadap outlier.
Contoh tepat: Lama rawat inap, pendapatan keluarga, kadar hormon yang skewed
Nilai yang paling sering muncul. Tepat untuk data nominal/kategorik.
Contoh tepat: Jenis persalinan yang paling umum di fasilitas
Ukuran pemusatan saja tidak cukup — dispersi data sama pentingnya:
Pasangan mean — untuk data normal
Interpretasi: ~68% data berada dalam ±1 SD dari mean; ~95% dalam ±2 SD
Contoh: Berat lahir 3.200 ± 420 gram
→ ~95% bayi beratnya antara 2.360–4.040 gram
Pasangan median — untuk data skewed
IQR = Q3 - Q1 (nilai tengah 50% dari distribusi)
Pelaporan yang tepat:
Median (IQR): 3 hari (2–7)
BUKAN: Median ± IQR
Untuk data nominal dan ordinal:
Format standar: n (%)
Contoh: Persalinan SC: 127/380 (33,4%)
Contoh dalam obstetri:
→ Berat lahir aterm
→ Tekanan darah diastolik
→ Kadar hemoglobin populasi umum
Right Skewed (positive skew):
Left Skewed (negative skew):
JENIS DATA OUTCOME?
Distribusi normal?
Gunakan uji non-parametrik
Uji asosiasi proporsi
| Pertanyaan Penelitian | Tipe Data | Uji Statistik yang Tepat |
|---|---|---|
| Apakah kadar Hb ibu hamil berbeda antara yang ANC < 4× vs ≥ 4×? | Kontinu, 2 kelompok | t-test atau Mann-Whitney |
| Apakah tekanan darah berbeda antara 3 trimester? | Kontinu, >2 kelompok berpasangan | Repeated measures ANOVA atau Friedman |
| Apakah proporsi SC berbeda antara 4 kelas RSUD? | Kategorik, >2 kelompok | Chi-square |
| Apakah skor nyeri sebelum dan sesudah analgesia berbeda? | Ordinal, 2 berpasangan | Wilcoxon signed rank |
| Apakah ada hubungan antara paritas dan berat lahir? | Kontinu vs. ordinal | Spearman correlation |
| Apakah ada hubungan antara usia ibu dan tekanan darah? | Kontinu vs. kontinu | Pearson atau Spearman |
| REALITAS | KEPUTUSAN STATISTIK | |
|---|---|---|
| H₀ Ditolak | H₀ Tidak Ditolak | |
| H₀ Benar |
KESALAHAN TIPE I (α) False Positive |
KEPUTUSAN BENAR True Negative |
| H₀ Salah |
KEPUTUSAN BENAR True Positive |
KESALAHAN TIPE II (β) False Negative |
Definisi: Probabilitas mendeteksi efek yang benar-benar ada
Nilai Konvensional:
Implikasi Praktis: Studi dengan power rendah (underpowered) berisiko tinggi menghasilkan false negative — menyimpulkan "tidak ada efek" padahal efek benar-benar ada.
RR adalah ukuran asosiasi utama dalam studi kohort dan RCT:
Risiko outcome pada kelompok terekspos
RR = ─────────────────────────────────────────
Risiko outcome pada kelompok kontrol
a/(a+b)
RR = ───────
c/(c+d)
│ Outcome+ │ Outcome- │
───────────┼──────────┼──────────┤
Eksposur+ │ a │ b │
Eksposur- │ c │ d │
Studi kohort: Ibu tanpa ANC vs. ANC lengkap
INTERPRETASI:
Ibu tanpa ANC memiliki risiko kematian 2,4× lebih tinggi dibanding ibu dengan ANC lengkap.
OR adalah ukuran asosiasi utama dalam studi kasus-kontrol:
Odds outcome pada kelompok terekspos
OR = ──────────────────────────────────────
Odds outcome pada kelompok tidak terekspos
a/b a×d
OR = ─── = ───
c/d b×c
HR adalah ukuran asosiasi dalam analisis survival (time-to-event):
CONTOH:
HR kematian ibu = 0,65 (95% CI: 0,48–0,87)
→ Program mengurangi hazard kematian sebesar 35% dibanding kontrol, dengan mempertimbangkan waktu follow-up yang berbeda.
Perbedaan absolut risiko antara kelompok
ARR = Risiko kontrol − Risiko intervensi
CONTOH:
Risiko eklamsia tanpa MgSO4: 8%
Risiko eklamsia dengan MgSO4: 3%
ARR = 8% − 3% = 5%
Proporsi pengurangan risiko relatif terhadap risiko kontrol
RRR = ARR / Risiko kontrol × 100%
DARI CONTOH YANG SAMA:
RRR = 5% / 8% × 100% = 62,5%
PERHATIAN: ARR = 5% (terdengar kecil) vs. RRR = 62,5% (terdengar besar). Keduanya BENAR — tetapi memberikan kesan yang sangat berbeda. Pemasaran farmasi sering menggunakan RRR karena terdengar lebih impresif.
Berapa pasien yang perlu diobati untuk mencegah satu kejadian?
NNT = 1 / ARR = 1 / 0,05 = 20
INTERPRETASI:
Perlu mengobati 20 ibu dengan MgSO4 untuk mencegah 1 kasus eklamsia.
ATURAN: NNT yang lebih kecil = intervensi lebih efisien.
Berapa pasien yang perlu terekspos untuk menyebabkan satu kejadian merugikan?
NNH = 1 / Absolute Risk Increase
ATURAN: NNH yang lebih besar = intervensi lebih aman.
Probabilitas mendapatkan hasil yang diamati (atau lebih ekstrem) JIKA H₀ benar
Definisi: Range nilai yang kompatibel dengan data yang diamati dengan tingkat kepercayaan 95%
RR = 1,35 (95% CI: 1,12–1,62)
OR = 0,78 (95% CI: 0,58–1,05)
RR = 2,8 (95% CI: 2,1–3,7), p < 0,001
NNT = 8
→ Gunakan bukti ini dengan yakin
RR = 1,04 (95% CI: 1,01–1,07), p = 0,02
NNT = 500
→ Studi sangat besar mendeteksi efek yang terlalu kecil untuk relevan secara klinis
RR = 0,72 (95% CI: 0,48–1,08), p = 0,11
→ Studi mungkin underpowered
→ Tidak dapat menyimpulkan "tidak ada efek"
→ Perlu studi yang lebih besar
RR = 0,98 (95% CI: 0,91–1,06), p = 0,63
→ Bukti yang cukup kuat bahwa tidak ada efek yang bermakna klinis
→ CI sempit, melewati 1 dengan nilai yang sangat dekat ke null
Untuk outcome kontinu (tekanan darah, berat lahir, kadar Hb)
Y = β₀ + β₁X₁ + β₂X₂ + ... + ε
Koefisien β:
→ Perubahan rata-rata Y untuk setiap
peningkatan 1 unit X, dengan
variabel lain dikontrol
CONTOH:
Berat lahir = 2.800 + 15(usia gestasi)
+ 120(gain BB ibu) − 180(merokok) + ε
β untuk usia gestasi = 15:
Setiap tambahan 1 minggu usia gestasi
berhubungan dengan penambahan
berat lahir 15 gram, dengan
gain BB dan merokok dikontrol
Untuk outcome biner (ya/tidak: preeklampsia, kematian, SC)
log(p/1-p) = β₀ + β₁X₁ + β₂X₂ + ...
HASIL UTAMA: Adjusted Odds Ratio (aOR)
= e^β (eksponensial koefisien)
CONTOH OUTPUT - Faktor risiko preeklampsia:
aOR 95% CI p
Usia > 35 th 2,3 1,7–3,1 <0,001
Obesitas (BMI>30) 1,8 1,4–2,4 <0,001
Nulipara 1,4 1,1–1,8 0,008
ANC < 4× 1,9 1,5–2,5 <0,001
INTERPRETASI aOR usia > 35:
Ibu usia > 35 tahun memiliki odds
preeklampsia 2,3× lebih tinggi
dibanding ibu < 35 tahun,
setelah dikontrol untuk obesitas,
paritas, dan kelengkapan ANC
COX PROPORTIONAL HAZARDS:
h(t) = h₀(t) × e^(β₁X₁ + β₂X₂ + ...)
HASIL UTAMA: Adjusted Hazard Ratio (aHR)
CONTOH:
aHR kematian ibu = 0,62
(95% CI: 0,45–0,85)
untuk kelompok yang mendapat
program pendampingan bidan
INTERPRETASI:
Program pendampingan bidan
mengurangi hazard kematian ibu
sebesar 38% (1 − 0,62 = 0,38),
setelah mengontrol variabel perancu,
dengan mempertimbangkan
waktu follow-up
Analisis utama: Analisis complete case (hanya yang tidak missing)
Analisis sensitivitas:
Interpretasi:
= Persentase variasi antar studi yang disebabkan heterogenitas (bukan sampling error)
Sebuah RCT cluster-randomized melaporkan hasil berikut tentang efektivitas program "Bidan Pendamping Komunitas" dalam mengurangi kematian ibu:
Penulis menyimpulkan: "Program tidak terbukti efektif dalam mengurangi kematian ibu."
Lakukan analisis kritis komprehensif terhadap kesimpulan ini:
Anda melakukan studi kasus-kontrol untuk menginvestigasi faktor risiko kematian ibu di kabupaten Anda.
Hasil analisis regresi logistik multivariat:
| Faktor Risiko | aOR | 95% CI | p-value |
|---|---|---|---|
| Tidak ada ANC | 4,2 | 1,8–9,7 | <0,001 |
| Jarak > 10 km ke fasilitas | 2,9 | 1,3–6,5 | 0,003 |
| BBLR | 3,1 | 1,4–6,9 | 0,005 |
| Bidan tidak tersertifikasi PONEK | 5,8 | 2,1–16,2 | <0,001 |
Analisis temuan ini:
Statistik deskriptif yang tepat dimulai dari memahami distribusi data — mean dan SD untuk data normal, median dan IQR untuk data skewed, frekuensi dan proporsi untuk data kategorik; pelaporan yang salah (misalnya: mean untuk data sangat skewed) menghasilkan gambaran yang menyesatkan tentang data yang sebenarnya ada.
Pemilihan uji statistik inferensial harus didasarkan pada jenis data outcome, jumlah kelompok yang dibandingkan, apakah kelompok independen atau berpasangan, dan distribusi data — menggunakan uji parametrik pada data yang sangat tidak normal, atau uji untuk dua kelompok ketika ada tiga kelompok, adalah kesalahan metodologis yang menghasilkan kesimpulan yang salah.
Ukuran asosiasi (RR, OR, HR) dan ukuran dampak (ARR, RRR, NNT) memberikan informasi yang berbeda dan sama-sama diperlukan — RRR sering melebih-lebihkan manfaat dibanding ARR; NNT adalah ukuran yang paling bermakna secara klinis karena langsung menjawab pertanyaan "berapa pasien harus diobati untuk mencegah satu kejadian".
p-value hanya menjawab pertanyaan apakah efek kompatibel dengan hipotesis null — ia tidak mengukur besarnya efek, tidak menentukan makna klinis, dan tidak membuktikan bahwa temuan adalah kebetulan; confidence interval memberikan informasi yang jauh lebih kaya karena menunjukkan presisi estimasi dan range efek yang kompatibel dengan data.
Analisis regresi memungkinkan pengendalian konfounding secara simultan dan menghasilkan adjusted OR, HR, atau koefisien yang mencerminkan hubungan "murni" antara satu variabel dengan outcome setelah variabel lain dikontrol — tetapi kualitas analisis regresi sangat bergantung pada pemeriksaan asumsi yang sering diabaikan dalam pelaporan penelitian.
| Mata Kuliah: | Metodologi Penelitian & Penulisan Ilmiah |
| Semester: | 1 | Periode 2 | Sesi 1 |
| Komponen | Deskripsi |
|---|---|
| Jenis Tugas | Tugas Kelompok Kedua — Sesi 1 |
| Minggu | Minggu ke-4 |
| Materi | Modul 2 (Desain Kuantitatif) + Modul 3 (Kualitatif & Mixed Methods) + Modul 4 (Biostatistik Terapan) |
| Bobot Nilai | 15% dari nilai akhir mata kuliah |
| Komposisi Kelompok | 3–4 orang (komposisi sama dengan tugas kelompok sebelumnya) |
| Batas Pengumpulan | Akhir Minggu ke-4 (7 hari sejak tugas dibuka) |
| Format Pengumpulan | Laporan Word/PDF + slide presentasi maksimal 12 slide |
| Panjang Laporan | 2.000–3.000 kata (tidak termasuk tabel, perhitungan, dan referensi) |
| Referensi | Minimal 6 referensi dalam format Vancouver |
Dinas Kesehatan Provinsi Sulawesi Tenggara telah menginvestasikan Rp 4,2 miliar selama dua tahun untuk program Kelas Ibu Hamil (KIH) yang diintensifkan di 48 Puskesmas — mencakup peningkatan frekuensi dari 4 sesi standar menjadi 8 sesi, penambahan modul nutrisi dan tanda bahaya, dan pelatihan fasilitator bidan.
Kepala Dinas meminta evaluasi komprehensif: apakah investasi ini menghasilkan perubahan outcome yang bermakna?
| Indikator | Sebelum | Sesudah |
|---|---|---|
| Cakupan ANC K4 | 61% | 74% |
| Rata-rata kenaikan BB ibu | 9,8 kg (SD 3,2) | 11,4 kg (SD 2,9) |
| Proporsi anemia trimester III | 38% | 29% |
| Proporsi BBLR | 12,4% | 9,8% |
| Persalinan di fasilitas | 68% | 79% |
| Kematian ibu/1.000 KH | 3,1 | 2,4 |
| Indikator | Periode 1 | Periode 2 |
|---|---|---|
| Cakupan ANC K4 | 59% | 63% |
| Rata-rata kenaikan BB ibu | 9,5 kg (SD 3,4) | 9,9 kg (SD 3,1) |
| Proporsi anemia trimester III | 40% | 36% |
| Proporsi BBLR | 13,1% | 11,2% |
| Persalinan di fasilitas | 66% | 70% |
| Kematian ibu/1.000 KH | 3,3 | 2,9 |
Untuk setiap pasang analisis berikut, lakukan perhitungan dan interpretasi yang diminta:
Tim biostatistik Dinas Kesehatan melakukan analisis regresi logistik multivariat dengan outcome BBLR. Berikut output (dimodifikasi untuk tujuan pembelajaran):
| Variabel | aOR | 95% CI | p-value |
|---|---|---|---|
| Program KIH intensif | 0,74 | 0,58–0,95 | 0,018 |
| Anemia trimester III | 2,31 | 1,87–2,85 | <0,001 |
| Usia ibu < 20 tahun | 1,68 | 1,22–2,31 | 0,001 |
| Usia ibu > 35 tahun | 1,43 | 1,08–1,89 | 0,012 |
| Paritas ≥ 4 | 1,55 | 1,19–2,02 | 0,001 |
| Jarak ke Puskesmas > 5 km | 1,27 | 0,98–1,65 | 0,071 |
| Tingkat pendidikan (SMP vs SD) | 0,82 | 0,64–1,06 | 0,128 |
| Tingkat pendidikan (SMA vs SD) | 0,71 | 0,54–0,94 | 0,016 |
Data kuantitatif menunjukkan bahwa program KIH intensif berhubungan dengan perbaikan beberapa indikator — tetapi tidak menjelaskan mengapa beberapa Puskesmas menunjukkan perbaikan yang jauh lebih besar dari yang lain, meskipun mendapat intervensi yang sama.
Kepala Dinas meminta satu halaman ringkasan eksekutif yang dapat dibaca dalam 5 menit dan menghasilkan keputusan yang tepat.
| Bagian | Komponen Penilaian Utama | Bobot |
|---|---|---|
| A1 | Identifikasi desain yang tepat; analisis kelebihan vs. ancaman; alternatif desain yang justified | 10% |
| A2a | Ketepatan uji statistik; verifikasi asumsi; interpretasi makna klinis | 10% |
| A2b | Ketepatan perhitungan DiD; interpretasi kontribusi program di atas tren kontrol | 10% |
| A2c | Ketepatan dan kelengkapan perhitungan RR/ARR/RRR/NNT; kualitas interpretasi kebijakan | 10% |
| A2d | Kedalaman analisis keterbatasan statistik untuk outcome jarang; implikasi untuk desain | 5% |
| B | Ketepatan interpretasi aOR; kedalaman analisis non-signifikan; interpretasi pola ordinal; verifikasi asumsi | 25% |
| C | Kualitas pertanyaan kualitatif; spesifisitas strategi pengumpulan data; kualitas joint display | 15% |
| D | Kejelasan untuk non-statistisian; kalibrasi ketidakpastian; spesifisitas rekomendasi | 15% |