ChatGPT Kini Bisa Ditanya Lewat Suara dan Gambar

OpenAI, perusahaan yang mengembangkan layanan chatbot ChatGPT, telah meluncurkan fitur-fitur baru serta pembaruan yang signifikan.
Dengan pembaruan tersebut, ChatGPT memungkinkan pengguna dapat melakukan percakapan suara dengan ChatGPT di Android dan iOS dan bertanya berbasis gambar di semua platform.
Dilansir detikINET dari Engadget, Jumat (29/9/2023) untuk tahap awal fitur-fitur tersebut akan tersedia untuk pengguna Plus dan Enterprise. Sementara untuk pengguna lain nantinya akan mendapatkan akses ke fitur berbasis gambar.
ADVERTISEMENT
SCROLL TO CONTINUE WITH CONTENT
Jika ingin mencobanya, pengguna harus memilih untuk ikut serta dalam percakapan suara di aplikasi ChatGPT (buka Pengaturan lalu Fitur Baru). Dengan mengetuk tombol mikrofon, pengguna dapat memilih dari lima suara yang berbeda.
OpenAI mengatakan bahwa percakapan suara bolak-balik ini didukung oleh model teks-ke-ucapan (text-to-speech) baru yang dapat menghasilkan audio seperti manusia hanya dari teks dan beberapa detik contoh ucapan. Ini menciptakan lima suara dengan bantuan aktor profesional.
Di sisi lain, sistem pengenalan suara Whisper milik perusahaan mengubah kata-kata yang diucapkan pengguna menjadi teks.
Fungsi berbasis gambar juga menarik. OpenAI mengatakan bahwa kamu dapat, misalnya, menunjukkan foto pemanggang kepada chatbot dan bertanya mengapa pemanggang tidak mau menyala, memintanya untuk membantu merencanakan makanan berdasarkan jepretan apa yang ada di lemari es kamu, atau memintanya untuk memecahkan masalah matematika yang kamu ambil.
OpenAI menggunakan GPT-3.5 dan GPT-4 untuk mendukung fitur pengenalan gambar. Untuk menggunakan fungsi berbasis gambar ChatGPT, ketuk tombol foto (pengguna harus mengetuk tombol plus terlebih dahulu di iOS atau Android) untuk mengambil foto atau memilih gambar yang sudah ada di perangkat.
Kamu bisa bertanya pada ChatGPT tentang beberapa foto dan menggunakan alat gambar untuk memfokuskan pada bagian tertentu dari gambar.
Dalam sebuah posting blog yang mengumumkan pembaruan, OpenAI mencatat adanya potensi bahaya. Di mana ada kemungkinan bagi pelaku kejahatan untuk meniru suara figur publik dan orang-orang biasa dan mungkin melakukan penipuan.
Itulah mengapa OpenAI berfokus pada percakapan suara ChatGPT dengan teknologi ini dan bekerja sama dengan mitra tertentu dalam kasus penggunaan terbatas lainnya.
Sedangkan untuk gambar, OpenAI bekerja sama dengan Be My Eyes, sebuah aplikasi gratis yang dapat digunakan oleh para tunanetra dan orang yang memiliki penglihatan rendah untuk membantu mereka memahami lingkungan sekitar mereka dengan lebih baik berkat para sukarelawan yang melakukan panggilan video dengan mereka.
"Para pengguna mengatakan kepada kami bahwa mereka merasa sangat berguna untuk melakukan percakapan umum tentang gambar yang kebetulan memiliki orang di latar belakang, seperti jika seseorang muncul di TV ketika Anda sedang mencoba untuk mengetahui pengaturan remote control Anda," kata OpenAI.
Perusahaan mencatat bahwa mereka juga membatasi bagaimana ChatGPT dapat menganalisis dan membuat pernyataan langsung tentang orang-orang yang muncul dalam gambar, karena ChatGPT tidak selalu akurat dan sistem ini harus menghormati privasi individu.
Mereka telah menerbitkan sebuah makalah tentang sifat-sifat keamanan dari fungsionalitas berbasis gambar, yang mereka sebut sebagai GPT-4 dengan visi.
ChatGPT lebih efektif dalam memahami teks bahasa Inggris dalam gambar daripada bahasa lainnya. OpenAI mengatakan bahwa chatbot berkinerja buruk dalam bahasa lain untuk saat ini, terutama jika menyangkut bahasa yang menggunakan skrip non-Romawi.
Oleh karena itu, mereka menyarankan agar pengguna non-Inggris menghindari penggunaan ChatGPT untuk menangani teks dalam gambar untuk saat ini.
Simak Video "ChatGPT Dibayang-bayangi Ancaman Bangkrut"
[Gambas:Video 20detik]
(jsn/fay)