Category Archives: Suara Ucapan

Pentingnya Akustik untuk Ruang Kelas Anak-anak

Salah satu faktor penting yang mempengaruhi proses belajar mengajar pada anak-anak di dalam kelas adalah terjaminnya proses komunikasi yang baik antara guru dan murid (dan sebaliknya). Dua faktor utama yang mempengaruhi proses mendengar di dalam ruangan kelas adalah kondisi akustik ruang kelas dan kemampuan mendengar anak (murid). Kondisi Akustik ruang kelas yang harus diperhatikan terutama adalah tingkat kebisingan dan waktu dengung ruang, serta rasio suara terhadap bising  (SNR).

Tingkat  kebisingan suara yang terjadi di ruangan kelas disebabkan oleh sumber dari luar ruangan (misalnya kendaraan yang lewat di jalanan di sekitar sekolah, aktifitas di dalam dan di luar lingkungan sekolah) dan sumber di dalam ruangan kelas (misalnya suara murid-murid, suara AC). Suara-suara tersebut pada akhirnya akan berkompetisi dengan suara guru, sehingga mengganggu proses komunikasi antara guru-murid dan sebaliknya. Jika tingkat bising terlalu tinggi, suara guru akan tenggelam di dalam bising, sehingga guru harus meningkatkan tingkat energi suara yang dikeluarkan (akibatnya guru lebih mudah letih). Faktor utama yang bisa digunakan untuk mengendalikan kebocoran/intrusi bising dari luar ruang kelas adalah dengan memastikan semua bukaan yang ada di ruang kelas memiliki sistem insulasi suara yang baik, sedangkan untuk mengendalikan bising yang bersumber dari dalam ruang kelas itu sendiri adalah dengan mengendalikan tingkat bising sumber yang menghasilkan suara.

Waktu dengung ruangan kelas memegang peranan penting dalam menciptakan tingkat kejelasan suara ucap dalam ruang. Waktu dengung ruang pada dasarnya berkaitan dengan jumlah energi pantulan yang dihasilkan oleh permukaan dalam ruangan, yang pada akhirnya mempengaruhi seberapa lama suara bertahan di dalam ruangan tersebut. Jumlah energi pantulan yang berlebihan ini akan berinteraksi dengan suara langsung dari guru yang datang ke telinga murid. Jika suara pantulan lebih dominan dari suara langsung, maka tingkat kejelasan suara ucapan akan menurun. Untuk mengatasi suara pantulan yang berlebihan ini, atau dengan kata lain menurunkan waktu dengung ruang kelas, dapat digunakan material penyerap suara, tentunya yang terbuat dari bahan yang aman bagi kesehatan respirasi murid dan guru. Waktu dengung yang disarankan untuk ruangan kelas adalah 0.45 – 1 detik tergantung dari volume ruangannya.

Selain Waktu Dengung ruang, Rasio Suara terhadap bising (Signal to Noise Ratio, SNR) adalah faktor akustik yang sangat mempengaruhi tingkat kejelasan suara ucapan di dalam ruangan kelas. Faktor ini terkait dengan seberapa besar energi suara ucap yang harus dihasilkan seorang guru dibandingkan dengan tingkat bising yang ada di dalam kelas. Suara guru berperan sebagai singal dan bising latar belakang (dan waktu dengung) memberikan kontribusi pada Noise Level. Beberapa penelitian menunjukkan bahwa tingkat energi suara yang dihasilkan guru disarankan 15 dB diatas tingkat bising di ruang kelas (Untuk dapat memahami percakapan secara komprehensif, anak-anak memerlukan guru berbicara  9 dB lebih keras dibandingkan orang dewasa). Apabila hal tersebut dapat dicapai, maka proses belajar mengajar akan berlangsung dengan komprehensif karena murid dapat memahami dengan baik apa yang disampaikan oleh guru mereka.

Hal lain yang perlu dicatat adalah, otak manusia baru berkembang sempurna pada saat usia mencapai 15 tahun. Hal ini juga mempengaruhi kemampuan mendengar manusia, karena sistem auditory nerve terkait dengan perkembangan otak. Oleh karena itu, kondisi lingkungan mendengar di ruangan belajar (ruang kelas) untuk  anak-anak ( < 15 tahun) menjadi lebih kritis dibandingkan dengan orang dewasa (>15 tahun). Sebagai konsekuensi logis dari kondisi ini, pertimbangan akustik pada perancangan ruang kelas untuk anak-anak (TK, SD dan SMP) menjadi lebih perlu diperhatikan dibandingkan dengan ruang kelas untuk remaja-dewasa (SMA dan Perguruan Tinggi).

Note: disarikan dari website http://www.classroomhearing.org/summary.html

Identifikasi Karakteristik Akustik Suara Pengucap termanipulasi Aktif: Studi kasus Penyulih Suara (dubber)

Salah satu upaya bangsa Indonesia untuk bangkit kembali adalah dengan pemberantasan korupsi. Adalah Komisi Pemberantasan Korupsi (KPK), sebagai lembaga negara yang mempunyai tugas khusus dalam mengungkap kasus-kasus korupsi di Indonesia. Salah satu bahan bukti awal adalah sadapan hasil dari pembicaraan seseorang dengan pihak lain yang dapat dicurigai sebagai bagian proses komunikasi yang berhubungan dengan tindak korupsi. Untuk keperluan forensik, sampel suara ucap dari beberapa rekaman sadapan harus dibandingkan dengan sampel suara dari tersangka tersebut yang direkam selama proses penyidikan. Hasil dari analisa sekumpulan sampel suara ucap harus memberikan kesimpulan apakah suara ucap itu dari sumber subjek yang sama atau tidak. Secara scientific produksi suara dapat dianalogikan dengan model source-filter, dimana laring sebagai sumber suara (source) dan supralaryngeal vocal tract sebagai filter akustik. Dengan model source-filter bahwa produksi suara ucap manusia digambarkan bahwa suara ucap manusia berasal dari suatu sumber suara yang melewati filter akustik. Sumber suara ini memiliki frekuensi yang disebut dengan frekuensi fundamental atau pitch. Sedangkan filter akustiknya memiliki frekuensi-frekuensi resonansi yang disebut dengan formant.

Satu tantangan dalam proses forensik, adalah seringkali tersangka tidak kooperatif dalam pengambilan sampel suara ucap selama proses penyidikan, sehingga diperlukan satu sistem identifikasi suara ucap yang dikembangkan untuk keperluan forensik. Satu pendekatan yang digunakan untuk estimasi sumber suara adalah berdasarkan ekstraksi ciri akustik dari suara ucap yang berbasis pada pitch dan/atau formant. Untuk keperluan identifikasi secara otomatis, perlu suatu sistem klasifikasi berbasis statistik untuk membuat suatu keputusan dari ciri akustik dari beragam sample suara ucap yang diproses.

Proses identifikasi akan semakin kompleks pada saat terjadi manipulasi/penyamaran (disguissing) suara dari subyek/tersangka akibat adanya modifikasi pada proses produksi suara baik yang terjadi pada bagian source dan atau filter. Modifikasi ini dapat terjadi secara pasif akibat perubahan keadaan emosi dari subyek misalnya dalam kondisi tertekan secara kejiwaan maupun mengalami gangguan kesehatan yang berhubungan dengan organ-organ pengucapan sehingga yang bersangkutan tidak dapat melakukan produksi suara-ucap secara normal. Modifikasi juga dapat terjadi secara aktif bila subyek dengan secara sengaja merubah warna suara maupun gaya bicara dari kebiasaan sehari-hari. Teknik yang bisa digunakan untuk jenis modifikasi yang terakhir ini salah satunya adalah voicing yaitu suatu teknik memanipulasi suara dengan phonation yang menyebabkan terjadinya perubahan frekuensi dasar(pitch) dari suara yang diucapkan pada waktu (timing) tertentu. Hal ini terjadi karena adanya modifikasi kekakuan dari glottis sehingga terjadi perubahan dari volume aliran udara (airstream) yang mengalir ke daerah vocal tract yang selanjutnya menghasilkan warna suara (tone) yang berbeda. Sementara itu, perubahan gaya bicara pada umumnya dilakukan dengan melakukan perubahan dalam penekanan (stressing) pengucapan pada suku kata tertentu, memperpanjang-memperpendek panjang ucapan,perubahan bentuk bibir, dll., sehingga berpengaruh pada intonasi ucapan.

Penelitian ini difokuskan untuk memperbanyak data base suara termanipulasi aktif, yang pada penelitian terdahulu telah digunakan pemain teater, dalang wayang golek, dan dalang wayang kulit, serta penyanyi tenor dan sopran. Pada penelitian kali ini, studi kasus akan menggunakan subjek suara penyulih suara (dubber), sebagai bentuk pengembangan lanjut dari sistem indentifikasi suara pengucap dengan suara yang termanipulasi aktif, dimana pengucap mampu memodifikasi suaranya dengan rentang yang cukup lebar, dan mampu merubah ciri khasnya. Dari tiap sampel suara, akan dilakukan ekstraksi ciri akustik untuk mendapatkan ciri akustik pitch dan Formant. Untuk deteksi dari ciri akustik pitch , akan dibandingkan metode yang berdasarkan frekuensi domain dan time-frekuensi domain. Tiga jenis formant yaitu dikenal dengan F1, F2 dan F3 yang biasa digunakan untuk ekstraksi ciri akustik dengan metode Linear Predictive Coding. Pada sistem klasifikasi ciri akustik, akan dilakukan pendekatan likelihood ratio, untuk mendeteksi besarnya rentang frekuensi suara termanipulasi aktif, khususnya untuk profesi Penyulih Suara (dubber).

Menu Riset 2012

Menu Riset di Group Akustik kami di tahun 2012 ini adalah:

1. Forensic Speaker Identification (Active Disguishing problem): 3 S1
2. Open-plan Office Acoustics (privacy vs Intelligibility) : 2 S1
3. Hospital Acoustics (privacy vs intelligibility) : 1 S2 , 1 S1
4. Archeological Acoustics (Cultural Preservation) : 2 S1
5. Indonesian Traditional Music Performance Hall (Design and Simulation) : 1 S3, 2 S1
6. Sound Insulations (Design and Measurements) : 1 S2
7. Active Noise Control (Algorithm and Design) : 1 S3
8. Binaural Sound Localization (Hardware Design) : 1 S2

Tim Peneliti yang terlibat dalam ke 8 topik tadi terdiri dari 4 staf dosen di Teknik Fisika ITB (topik 1-6), 3 Staff Dosen di Teknik Elektro (topik 7-8), 1 Dosen Teknik Fisika UGM (topik2), 2 Mahasiswa S3, 3 Mahasiswa S2, dan 10 Mahasiswa S1, serta 1 Asisten Riset.

Suara Manusia: Unik kah?

Manusia diciptakan oleh Sang Maha Pencipta penuh dengan keunikan. Kepala manusia, tidak ada yang identik, even untuk anak yang kembar identik sekalipun. Dalam dunia identifikasi untuk keperluan forensik, pada umumnya penyidik menggunakan Sidik Jari sebagai tanda unik seorang manusia. Sidik jari juga digunakan untuk identifikasi seseorang dalam sistem informasi, seperti password. Hal lain yang digunakan adalah karakter Retina mata. Retina mata juga diciptakan unik untuk setiap manusia. Identifikasi retina juga sudah banyak digunakan dalam bidang forensik maupun Information Security.  Seiring dengan perkembangan dunia kedokteran/biologi, DNA kemudian menjadi salah satu alat identifikasi keunikan seorang manusia.  Sidik jari, retina mata dan DNA adalah ciri keunikan manusia yang sifatnya statis.

Bagaimana dengan suara? Dengan pendekatan source-filter model, pada dasarnya setiap manusia dikaruniai dengan sebuah sistem pembangkit suara (rongga perut-membran-rongga dada) vocal fold dan sistem modulator/resonator yang kompleks  (filter) yang disebut vocal tract (mulai dari laryng sampai bibir). Sistem Vocal tract manusia bersifat unik, sehingga pada kondisi normal suara seorang manusia adalah unik. Sehingga, kalau kita sudah pernah mendengar suara seseorang (berulang-ulang), kita bisa dengan mudah mengenal orang dari suaranya sajah. Itu sebabnya suara mulai digunakan sebagai identitas unik manusia dalam dunia forensik maupun sistem security informasi. Akan tetapi, berbeda dengan sidik jari, retina dan DNA, identitas suara manusia bersifat dinamis. Perubahan kondisi psikis maupun kondisi fisik vocal tract (misalnya sakit flu) akan mengubah karakter resonansi atau filtering, sehingga suara manusia tersebut bisa berubah. Perubahan tersebut tentu saja bisa dilakukan dengan sengaja, misalnya seperti yang dilakukan oleh para pemain drama atau aktor monolog, yang bisa menirukan suara orang lain.

Oleh karenanya, identifikasi suara untuk keperluan forensik menjadi sangat kompleks, tidak seperti identifikasi sidik jari, retina maupun DNA yang lebih straightforward. Sebuah penelitian tengah dilakukan di Teknik Fisika ITB, untuk menganalisis suara yang dengan sengaja diubah karakternya. Target yang ingin diketahui adalah, karakter apa yang tetap tidak berubah walaupun warna suara ucapannya adalah suara orang lain.