Kenangan Malam dan Kamera Jadul yang Masih Kupakai
Pukul dua pagi, musim panas 2018, saya duduk di kursi tuang—kamera film tua tergantung di leher, laptop terbuka, dan kamar kos yang redup penuh kabel. Di layar, batch pelatihan terakhir menunjukkan kurva loss yang menurun perlahan. Di kepala saya melintas kontras antara dua dunia: kata “kenangan” muncul bersama metadata gambar RAW; suara jarum jam beradu dengan suara kipas GPU. Kamera jadul itu bukan sekadar properti estetika. Ia adalah sumber data yang membuat saya belajar tentang batasan dan peluang machine learning pada kondisi nyata—terutama malam hari dengan noise, blur, dan karakter sensor yang unik.
Malam yang Panjang dan Kamera Tua
Saya membeli Canon EOS 300V bekas dari pasar loak tahun 2015, lalu memakainya untuk memotret teman-teman setelah kelas salsa di delraybeachballroom. Kamera itu menangkap tonal warna hangat yang tidak ada pada sensor modern—grain berbeda, highlight yang “jatuh” secara dramatis. Awalnya saya hanya ingin merekam momen. Kemudian saya mulai berpikir: bagaimana model denoising atau low-light enhancement menghadapi foto yang diambil dari kamera dengan ciri fisik seperti ini? Tantangannya jelas: distribusi noise bukan Gaussian sederhana; ada pola demosaicing, clipping, dan artefak scan film yang ‘mengeluh’ pada model konvensional.
Membangun Dataset dari Foto Jadul
Mengumpulkan data jadi fase penting. Saya memindai negatif dan menyimpan RAW dari kamera digital yang lebih tua—sekitar 3.200 frame. Saya membuat pasangan input-target dengan menggabungkan long exposure sebagai ground truth ketika memungkinkan, dan mensimulasikan noise Poisson-Gaussian untuk variasi. Patch 256×256; augmentasi meliputi rotasi, flipping, random gamma, dan simulasi ISO tinggi. Ada momen frustrasi: satu seri foto malam yang saya ambil di stasiun kereta, lampu sodium membuat warna berubah aneh. Internal monolog saya: “Apakah ini masih boleh disebut data?” Jawabannya: ya. Justru keragaman inilah yang membuat model lebih robust.
Saya memakai preprocessing yang tidak biasa: bekerja pada RAW sebelum demosaicing, memasukkan operasi ISP (demosaic → white balance → tone map) sebagai bagian dari pipeline pelatihan. Teknik ini memungkinkan model belajar koreksi yang spesifik pada karakter kamera jadul, bukan hanya menghapuskannya.
Melatih Model dan Memahami Batasannya
Model pertama saya adalah U-Net dengan residual block, loss kombinasi L1 + perceptual (VGG feature). Parameter yang saya gunakan: Adam lr=1e-4, batch size 8, 50 epoch, early stopping dengan patience 5. Hasilnya? PSNR meningkat, tetapi kadang wajah yang tadinya hangat menjadi steril. Ini momen pelajaran utama: metrik kuantitatif tidak selalu mencerminkan nilai estetis atau kenangan yang hendak dipertahankan.
Saya mencoba fine-tuning dari pre-trained denoiser (DnCNN), lalu memodifikasi loss dengan term yang mempertahankan tonal karakter (feature regularizer). Saya juga bereksperimen dengan GAN untuk low-light enhancement—adversarial loss membantu subyektivitas fotos itu, tetapi menambah risiko hallucination: objek kecil muncul dari noise. Pada satu malam, saya melihat model “menambahkan” bayangan orang yang sebenarnya tidak ada. Saya berhenti sejenak. Internal dialog: “Lebih baik resolusi yang jujur atau foto yang terasa benar tapi tidak akurat?” Jawabannya bergantung pada konteks: untuk arsip pribadi, keaslian lebih penting; untuk estetika, kompromi bisa diterima.
Apa yang Kuambil dari Semua Malam Ini
Akhirnya, hasil terbaik bukan model paling canggih, tetapi pipeline yang memahami konteks pengambilan gambar. Saya menggabungkan pendekatan: preprocessing RAW-aware, transfer learning, loss gabungan, dan validasi subyektif melalui sesi melihat bersama teman. Malam-malam panjang itu mengajarkan satu hal: machine learning adalah alat yang kuat, tapi ia bekerja paling baik bila kita memberi konteks—sensor, cerita, tujuan pengguna. Kamera jadul saya masih kupakai; kadang saya sengaja memotret pada ISO tinggi untuk “mengusik” model saya, mencoba melihat respon sistem terhadap ketidaksempurnaan.
Jika saya memberi saran kepada engineer yang mulai bekerja dengan data visual dunia nyata: jangan hapus karakter terlalu cepat. Simpan sampel mentah, dokumentasikan kondisi pengambilan (waktu, lensa, eksposur), dan evaluasi hasil dengan mata manusia, bukan hanya angka. Ingat juga: nostalgia bukan musuh. Kadang yang dicari pengguna adalah feel, bukan fidelity mutlak. Itu pelajaran yang saya bawa dari malam-malam panjang, dari kamera jadul yang masih kupakai, sampai model yang kini menjadi lebih peka terhadap cerita di balik setiap piksel.