IMMORTAL

Pages

Thursday, May 10, 2018

Deep Learning



1. Pendahuluan
Deep learning adalah salah satu cabang dari ilmu pembelajaran mesin (Machine Learning) yang terdiri algoritme pemodelan abstraksi tingkat tinggi pada data menggunakan sekumpulan fungsi transformasi non-linear yang ditata berlapis-lapis dan mendalam. Teknik dan algoritme dalam Pembelaran dalam dapat digunakan baik untuk kebutuhan pembelajaran terarah (supervised learning), pembelajaran tak terarah (unsupervised learning) dan semi-terarah (semi-supervised learning) dalam berbagai aplikasi seperti pengenalan citra, pengenalan suara, klasifikasi teks, dan sebagainya. Model pada Pembelaran Dalam pada dasarnya dibangun berdasarkan Jaringan saraf tiruan, yang risetnya sudah berlangsung sejak era 80an namun baru-baru ini kembali bangkit dengan adanya komputer yang semakin cepat apalagi ditambah dengan kemampuan Kartu grafis modern yang mampu melakukan kalkulasi berbasis matriks secara simultan.
Berdasarkan riset yang baru-baru ini dilakukan, Pembelajaran Dalam mampu melakukan pengenalan grafis, pola tulis tangan dan beberapa pola lainnya lebih akurat dibandingkan dengan algoritme pembelajaran mesin lainnya

2. Arsitektur

1)      Deep Feedforward Network
Deep Feedforward Network atau dikenal dengan Multilayer Perceptron (MLP) merupakan pengembangan dari Jaringan saraf tiruan yang menekankan pada penggunakan satu atau lebih lapis tersembunyi (hidden layer) pada jaringannya dan penggunaan fungsi transformasi non-linear sebagai fungsi transformasi. Jaringan ini disebut Feedforward oleh karena sifatnya yang membawa informasi dari lapis masukan (input layer) untuk dibawa dan ditransformasi ke depan hingga lapis luaran (output layer).

2)      Recurrent Neural Network

Recurrent Neural Network merupakan pengembangan dari Deep Feedforward Network yang mana informasi dari suatu neuron dapat berputar kembali ke neuron yang sama (Deep Feddforward Network hanya membawa informasi ke lapis A ke lapis B secara progresif tanpa kembali ke lapis sebelumnya).

3)      Convolutional Neural Network

Convolutional Neural Network merupakan modifikasi dari Deep Feedforward Network yang mana setiap lapisnya dibuat dalam bentuk topologi grid mendalam.

3. Studi Kasus

1.      Automatic speech recognition

Large-scale automatic speech recognition adalah yang pertama dan paling berhasil dalam belajar yang mendalam. LSTM RNN dapat mempelajari tugas "Sangat Dalam Pembelajaran" yang melibatkan interval multi-detik yang berisi peristiwa ucapan yang dipisahkan oleh ribuan langkah waktu diskrit, di mana satu langkah waktu sesuai dengan sekitar 10 mdtk. LSTM dengan gerbang lupa kompetitif dengan pengenalan ucapan tradisional pada tugas-tugas tertentu.
Keberhasilan awal dalam speech recognition didasarkan pada tugas small-scale recognition berdasarkan TIMIT. Set data berisi 630 pembicara dari delapan dialek utama bahasa Inggris Amerika, di mana setiap pembicara membaca 10 kalimat. Ukurannya yang kecil memungkinkan banyak konfigurasi dicoba. Lebih penting lagi, tugas TIMIT menyangkut pengenalan urutan-ponsel, yang, tidak seperti pengenalan urutan kata, memungkinkan model bahasa yang lemah (tanpa tata bahasa yang kuat). [Klarifikasi diperlukan] Hal ini memungkinkan kelemahan dalam aspek pemodelan akustik pengenalan suara lebih mudah dianalisis . Tingkat kesalahan yang tercantum di bawah ini, termasuk hasil awal ini dan diukur sebagai persentase tingkat kesalahan telepon (PER), telah diringkas selama 20 tahun terakhir

Debut DNN untuk speaker recognition di akhir 1990-an dan pengenalan pidato sekitar 2009-2011 dan LSTM sekitar 2003-2007, mempercepat kemajuan di delapan bidang utama.
·         Scale-up/out and acclerated DNN training and decoding
·         Sequence discriminative training
·         Feature processing by deep models with solid understanding of the underlying mechanisms
·         Adaptation of DNNs and related deep models
·         Multi-task and transfer learning by DNNs and related deep models
·         CNNs and how to design them to best exploit domain knowledge of speech
·         RNN and its rich LSTM variants
·         Other types of deep models including tensor-based models and integrated deep generative/discriminative models.
Semua sistem speech recognition komersial (misalnya, Microsoft Cortana, Xbox, Skype Translator, Amazon Alexa, Google Now, Siri Apple, Baidu dan pencarian suara iFlyTek, dan berbagai produk pidato Nuansa, dll.) Didasarkan pada deep learning.

2.      Mobile Adevertising
Menemukan pemirsa seluler yang sesuai untuk iklan seluler selalu menantang, karena banyak titik data harus dipertimbangkan dan diasimilasi sebelum segmen target dapat dibuat dan digunakan dalam penayangan iklan oleh server iklan apa pun. Pembelajaran mendalam telah digunakan untuk menginterpretasikan dataset iklan besar yang banyak berdimensi. Banyak titik data dikumpulkan selama siklus iklan permintaan / melayani / klik internet. Informasi ini dapat membentuk dasar pembelajaran mesin untuk meningkatkan pemilihan iklan.

3.      Image Recognition
Kumpulan evaluasi umum untuk klasifikasi gambar adalah kumpulan data basis data MNIST. MNIST terdiri dari digit tulisan tangan dan mencakup 60.000 contoh pelatihan dan 10.000 contoh pengujian. Seperti TIMIT, ukurannya yang kecil memungkinkan pengguna menguji beberapa konfigurasi. Daftar lengkap hasil di set ini tersedia.
Pengenalan gambar berbasis pembelajaran dalam telah menjadi "manusia super", menghasilkan hasil yang lebih akurat daripada kontestan manusia. Ini pertama terjadi pada 2011.
Kendaraan yang terlatih dalam pembelajaran mendalam sekarang menginterpretasikan pemandangan kamera 360 °. Contoh lain adalah Analisis Genetika Facial Dysmorphology (FDNA) yang digunakan untuk menganalisis kasus-kasus malformasi manusia yang terhubung ke database besar sindrom-sindrom genetik.

Refence : https://en.wikipedia.org/wiki/Deep_learning