OpenAI Ungkap Alasan ChatGPT Jadi Terlalu Menjilat dan Meresahkan
Teknologi

OpenAI telah menerbitkan postmortem soal masalah terbaru usai model AI bawaan yang mendukung ChatGPT, GPT-4o.
Masalah tersebut memaksa OpenAI untuk mengembalikan pembaruan pada model yang dirilis minggu lalu.
Selama akhir pekan, setelah pembaruan model GPT-4o, pengguna di media sosial mencatat bahwa ChatGPT mulai merespons dengan cara yang terlalu memvalidasi dan menyenangkan.
Baca Juga: Tak Ingin "Dibully" Elon Musk, OpenAI Beberkan Hal Ini
Hal itu pun dengan cepat dijadikan meme oleh pengguna. Pengguna mengunggah tangkapan layar ChatGPT yang memuji segala macam keputusan dan ide yang bermasalah dan berbahaya .
Dalam sebuah posting di X pada hari Minggu, CEO Sam Altman mengakui masalah tersebut dan mengatakan bahwa OpenAI akan segera memperbaikinya.
Dua hari kemudian, Altman mengumumkan bahwa pembaruan GPT-4o sedang dibatalkan dan bahwa OpenAI sedang mengerjakan "perbaikan tambahan" pada kepribadian model tersebut.
Baca Juga: Dituding Melanggar Hak Cipta, Microsoft dan OpenAI Digugat
Menurut OpenAI , pembaruan tersebut bermaksud dimaksudkan untuk membuat kepribadian default model “terasa lebih intuitif dan efektif,” terlalu banyak dipengaruhi oleh “umpan balik jangka pendek” dan “tidak sepenuhnya memperhitungkan bagaimana interaksi pengguna dengan ChatGPT berkembang seiring waktu.”
"Akibatnya, GPT‑4o cenderung memberikan respons yang terlalu mendukung tetapi tidak jujur," tulis OpenAI dalam posting blognya.
"Interaksi yang menjilat bisa jadi tidak nyaman, meresahkan, dan menyebabkan tekanan. Kami gagal dan sedang berupaya memperbaikinya."
OpenAI mengatakan bahwa mereka menerapkan beberapa perbaikan, termasuk menyempurnakan teknik pelatihan model inti dan perintah sistem untuk secara eksplisit mengarahkan GPT-4o menjauh dari sikap menjilat.
Perusahaan juga membangun lebih banyak pagar pengaman untuk meningkatkan kejujuran dan transparansi model, dan terus memperluas evaluasinya untuk membantu mengidentifikasi masalah di luar sikap menjilat.
OpenAI juga mengatakan bahwa pihaknya tengah bereksperimen dengan berbagai cara untuk memungkinkan pengguna memberikan “umpan balik waktu nyata” guna “secara langsung memengaruhi interaksi mereka” dengan ChatGPT dan memilih dari berbagai kepribadian ChatGPT.
OpenAI mengatakan, perusahaan sedang menjajaki cara-cara baru untuk memasukkan umpan balik yang lebih luas dan demokratis ke dalam perilaku default ChatGPT.
“Kami berharap umpan balik tersebut akan membantu kami lebih mencerminkan nilai-nilai budaya yang beragam di seluruh dunia dan memahami bagaimana Anda ingin ChatGPT berkembang … Kami juga percaya pengguna harus memiliki kontrol lebih besar atas perilaku ChatGPT dan, sejauh aman dan memungkinkan, melakukan penyesuaian jika mereka tidak setuju dengan perilaku default,” kata perusahaan.
Sumber: Techcrunch