SINGAPURA (IndoTelko) - Robot Process Automation (RPA) alias memakai robot untuk mengotomatisasi proses kerja telah berhasil menghadirkan pembuatan dokumen dan pengisian data secara otomatis. Namun beberapa pekerjaan seperti menulis minuta rapat dan transkrip pidato masih dilakukan secara manual.
Toshiba tengah mengembangkan teknologi kecerdasan buatan (AI) untuk pemindaian percakapan (speech recognition). Teknologi ini mampu mengubah percakapan menjadi teks dengan akurasi yang baik, serta ikut meningkatkan produktivitas kerja dan bidang-bidang lainnya.
Pada 2015, saat Toshiba mulai mengembangkan AI dalam format ini, momentum aksesibilitas informasi tengah meningkat. Aksesibilitas informasi ingin menciptakan lingkungan yang membantu orang dengan gangguan pendengaran untuk mengakses dan menginput informasi.
Toshiba meminta masukan dari para pegawai dengan gangguan pendengaran yang ingin mengikuti rapat dan ceramah secara seketika. Untuk itu, pengembangan AI untuk pemindaian percakapan yang dijalankan Toshiba berfokus pada dua aspek—memperluas aksesibilitas informasi bagi orang dengan gangguan pendengaran, serta meningkatkan produktivitas.
Algoritme membentuk bagian inti AI, dan tim pengembang menjajaki beragam pendekatan guna menambah akurasi.
AI untuk pemindaian percakapan dari Toshiba tak hanya mengenali percakapan dengan akurasi yang baik, namun juga mendeteksi jeda (filler) dan keragu-raguan (hesitation marker) saat berbicara. Dengan memanfaatkan model yang kian populer seperti Long Short-Term Memory (LSTM) dan Connectionist Temporal Classification (CTC), AI diajari untuk mengenal keunikan dalam percakapan, seperti jeda dan keragu-raguan yang hanya dimiliki manusia.
Ketika dipakai dalam kegiatan perkuliahan sebagai verifikasi, AI untuk pemindaian percakapan mencapai rasio sebesar 85%, yakni mampu mengenali konten pembicaraan di atas level tertentu tanpa perlu menyunting atau pembelajaran lebih lanjut. Toshiba akan terus membenahi teknologi ini demi mewujudkan pemindaian percakapan yang sepenuhnya akurat. Dengan demikian, Toshiba membantu para pembicara dari berbahasa yang berbeda-beda agar mereka dapat saling berbincang dengan lancar.
Toshiba juga menyadari potensi penggunaaan AI untuk pemindaian percakapan di sektor manufaktur. Sektor ini membutuhkan pengumpulan dan perekaman suara tanpa bantuan tangan (hands-free) di berbagai pabrik saat kegiatan pemeliharaan dan inspeksi berlangsung.
Ke depan, Toshiba ingin memanfaatkan wawasan dan keahliannya di sejumlah fasilitas manufaktur untuk mengintegrasikan pemindaian percakapan secara lancar ke dalam kegiatan operasional pabrik.(pg)