Pidato ke Perangkat Teks
Perangkat ucapan-ke-teks menghemat waktu pengguna dengan menerjemahkan rekaman audio menjadi teks di layar. Meskipun perangkat ini adalah perangkat keras yang berhubungan dengan komputer, pengenalan suara dan proses terjemahan diselesaikan oleh perangkat lunak pengenalan suara. Ada beberapa perekam suara digital yang berbeda untuk dipilih, dan beberapa jenis program pengenalan suara.
Suara saat bepergian
Perangkat lunak berlangganan bayar sesuai penggunaan ini memiliki berbagai fitur yang berfungsi di ponsel apa pun. Pengguna dapat membuat dan mengirim pesan teks 15 detik menggunakan suara mereka. Ini juga dapat digunakan untuk memperbarui status jejaring sosial, dan bahkan membuat teks pendek bergaya "Twitter", yang kemudian disinkronkan dengan akun Internet pribadi Anda melalui nirkabel atau GPS (Global Positioning System).
Vlingo Plus
Vlingo Plus adalah perangkat lunak pengenalan suara untuk pengguna BlackBerry. Alih-alih sistem bayar sesuai pemakaian, ini membutuhkan pembelian on-off dasar. Program ini memungkinkan pengguna memberi tahu ponsel BlackBerry mereka untuk mengirim pesan teks, email, panggilan, dan memperbarui status dengan teks pendek melalui tombol samping. Tombol ini mudah ditemukan dengan sentuhan bahkan saat Anda tidak dapat melihat perangkat dengan benar, seperti dalam gelap atau saat Anda sedang joging.
Tangan besar
BigHand adalah program pidato-ke-teks yang dirancang dan diimplementasikan oleh perusahaan BigHand yang berbasis di Inggris. Pengguna merekam suara mereka menggunakan apa yang pada dasarnya adalah dictaphone di dalam perangkat komunikasi seluler (seperti ponsel pintar atau BlackBerry). Rekaman suara kemudian dikirim ke alur kerja pengenalan suara dan suara (kata-kata) ditranskripsi menjadi teks, opsional dengan pemeriksaan, yang menambah akurasi dan keterbacaan. Ini berguna untuk teks terperinci, seperti dokumentasi hukum dan pembuatan catatan. Setiap kesalahan dapat diperbaiki oleh pengguna, seperti yang dijelaskan oleh BigHand.
Naga Berbicara Secara Alami
Dragon adalah program dikte serbaguna, yang dibuat oleh Nuance, yang memungkinkan pengguna di berbagai profesi untuk membuat dan mengedit data dalam dokumentasi dan email tanpa harus mengetik – mereka cukup membuat perubahan menggunakan perintah suara. Selain itu, karya lengkap dapat dikembangkan menggunakan dikte daripada mengetik, cukup dengan menyalakan program dan berbicara ke mikrofon saat merekam. Dragon menawarkan dokumentasi klinis dan komunikasi berbasis ucapan untuk industri perawatan kesehatan. Dragon juga digunakan untuk meningkatkan interaksi pelanggan untuk berbagai perusahaan komunikasi dan pusat panggilan.
Praktek terbaik
Untuk mendapatkan hasil maksimal dari perangkat pengenalan suara atau program perangkat lunak apa pun, program harus dilatih untuk mengenali jumlah minimum suara asli. Ini karena algoritme dalam perangkat lunak bekerja dengan mempelajari nuansa suara dan aksen orang tersebut dari waktu ke waktu. Jika perangkat digunakan oleh satu orang atau sekelompok kecil orang, akurasinya bisa mencapai 85 persen, tetapi angka ini turun dengan cepat untuk jumlah pengguna yang lebih besar. Perangkat lunak pengenalan juga bekerja dengan belajar dari kesalahannya, jadi selalu bijaksana untuk melakukan koreksi manual setelah terjemahan.