1. Pendahuluan
Deep learning adalah salah satu
cabang dari ilmu pembelajaran mesin (Machine
Learning) yang
terdiri algoritme pemodelan abstraksi tingkat tinggi pada data menggunakan
sekumpulan fungsi transformasi non-linear yang ditata berlapis-lapis dan
mendalam. Teknik dan algoritme dalam Pembelaran dalam dapat digunakan baik
untuk kebutuhan pembelajaran terarah (supervised learning), pembelajaran
tak terarah (unsupervised learning) dan semi-terarah (semi-supervised
learning) dalam berbagai aplikasi seperti pengenalan citra, pengenalan
suara, klasifikasi teks, dan sebagainya. Model pada Pembelaran Dalam pada
dasarnya dibangun berdasarkan Jaringan saraf
tiruan, yang risetnya sudah berlangsung sejak era 80an namun baru-baru
ini kembali bangkit dengan adanya komputer yang semakin cepat apalagi ditambah
dengan kemampuan Kartu grafis modern
yang mampu melakukan kalkulasi berbasis matriks secara simultan.
Berdasarkan riset yang baru-baru ini dilakukan, Pembelajaran
Dalam mampu melakukan pengenalan grafis, pola tulis tangan dan beberapa pola
lainnya lebih akurat dibandingkan dengan algoritme pembelajaran mesin lainnya
2. Arsitektur
1)
Deep
Feedforward Network
Deep Feedforward Network atau dikenal dengan Multilayer
Perceptron (MLP) merupakan pengembangan dari Jaringan
saraf tiruan yang menekankan pada penggunakan satu atau lebih lapis
tersembunyi (hidden layer) pada jaringannya dan penggunaan fungsi transformasi non-linear
sebagai fungsi transformasi. Jaringan ini disebut Feedforward oleh karena
sifatnya yang membawa informasi dari lapis masukan (input layer) untuk dibawa dan ditransformasi ke depan hingga lapis
luaran (output layer).
2)
Recurrent
Neural Network
Recurrent Neural Network merupakan pengembangan dari Deep
Feedforward Network yang mana informasi dari suatu neuron dapat
berputar kembali ke neuron yang sama (Deep Feddforward Network hanya membawa
informasi ke lapis A ke lapis B secara progresif tanpa kembali ke lapis
sebelumnya).
3)
Convolutional
Neural Network
Convolutional Neural Network merupakan modifikasi dari Deep
Feedforward Network yang mana setiap lapisnya dibuat dalam bentuk topologi grid
mendalam.
3. Studi Kasus
1.
Automatic
speech recognition
Large-scale
automatic speech recognition adalah yang pertama dan paling berhasil dalam
belajar yang mendalam. LSTM RNN dapat mempelajari tugas "Sangat Dalam
Pembelajaran" yang melibatkan interval multi-detik yang berisi peristiwa
ucapan yang dipisahkan oleh ribuan langkah waktu diskrit, di mana satu langkah
waktu sesuai dengan sekitar 10 mdtk. LSTM dengan gerbang lupa kompetitif dengan
pengenalan ucapan tradisional pada tugas-tugas tertentu.
Keberhasilan
awal dalam speech recognition didasarkan pada tugas small-scale recognition berdasarkan
TIMIT. Set data berisi 630 pembicara dari delapan dialek utama bahasa Inggris
Amerika, di mana setiap pembicara membaca 10 kalimat. Ukurannya yang kecil
memungkinkan banyak konfigurasi dicoba. Lebih penting lagi, tugas TIMIT
menyangkut pengenalan urutan-ponsel, yang, tidak seperti pengenalan urutan
kata, memungkinkan model bahasa yang lemah (tanpa tata bahasa yang kuat).
[Klarifikasi diperlukan] Hal ini memungkinkan kelemahan dalam aspek pemodelan
akustik pengenalan suara lebih mudah dianalisis . Tingkat kesalahan yang tercantum
di bawah ini, termasuk hasil awal ini dan diukur sebagai persentase tingkat
kesalahan telepon (PER), telah diringkas selama 20 tahun terakhir
Debut
DNN untuk speaker recognition di akhir 1990-an dan pengenalan pidato sekitar
2009-2011 dan LSTM sekitar 2003-2007, mempercepat kemajuan di delapan bidang
utama.
·
Scale-up/out and acclerated DNN
training and decoding
·
Sequence discriminative training
·
Feature processing by deep models
with solid understanding of the underlying mechanisms
·
Adaptation of DNNs and related deep
models
·
Multi-task and transfer learning by DNNs and related deep
models
·
CNNs and how to design them to best
exploit domain knowledge of speech
·
RNN and its rich LSTM
variants
·
Other types of deep
models including tensor-based models and integrated deep
generative/discriminative models.
Semua sistem speech recognition komersial
(misalnya, Microsoft Cortana, Xbox, Skype Translator, Amazon Alexa, Google Now,
Siri Apple, Baidu dan pencarian suara iFlyTek, dan berbagai produk pidato
Nuansa, dll.) Didasarkan pada deep learning.
2.
Mobile Adevertising
Menemukan pemirsa seluler yang
sesuai untuk iklan seluler selalu menantang, karena banyak titik data harus
dipertimbangkan dan diasimilasi sebelum segmen target dapat dibuat dan
digunakan dalam penayangan iklan oleh server iklan apa pun. Pembelajaran
mendalam telah digunakan untuk menginterpretasikan dataset iklan besar yang
banyak berdimensi. Banyak titik data dikumpulkan selama siklus iklan permintaan
/ melayani / klik internet. Informasi ini dapat membentuk dasar pembelajaran
mesin untuk meningkatkan pemilihan iklan.
3.
Image Recognition
Kumpulan evaluasi umum untuk klasifikasi
gambar adalah kumpulan data basis data MNIST. MNIST terdiri dari digit tulisan
tangan dan mencakup 60.000 contoh pelatihan dan 10.000 contoh pengujian.
Seperti TIMIT, ukurannya yang kecil memungkinkan pengguna menguji beberapa
konfigurasi. Daftar lengkap hasil di set ini tersedia.
Pengenalan gambar berbasis
pembelajaran dalam telah menjadi "manusia super", menghasilkan hasil
yang lebih akurat daripada kontestan manusia. Ini pertama terjadi pada 2011.
Kendaraan yang terlatih dalam
pembelajaran mendalam sekarang menginterpretasikan pemandangan kamera 360 °.
Contoh lain adalah Analisis Genetika Facial Dysmorphology (FDNA) yang digunakan
untuk menganalisis kasus-kasus malformasi manusia yang terhubung ke database
besar sindrom-sindrom genetik.
Refence : https://en.wikipedia.org/wiki/Deep_learning