Mengapa Claude Anthropic masih belum mengalahkan Pokémon

Salah satu hal terbesar yang mencegah versi Claude saat ini menjadi lebih baik, kata Hershey, adalah bahwa “ketika itu memperoleh strategi yang baik itu, saya tidak berpikir itu memiliki kesadaran diri untuk mengetahui bahwa satu strategi [it] datang dengan lebih baik dari yang lain. ” Dan itu bukan masalah sepele untuk dipecahkan.

Namun, Hershey mengatakan dia melihat “buah yang menggantung rendah” untuk meningkatkan permainan Pokémon Claude dengan meningkatkan pemahaman model tentang tangkapan layar Game Boy. “Saya pikir ada kemungkinan itu bisa mengalahkan permainan jika memiliki perasaan sempurna tentang apa yang ada di layar,” kata Hershey, mengatakan bahwa model seperti itu mungkin akan melakukan “sedikit kekurangan manusia.”

Memperluas jendela konteks untuk model Claude di masa depan mungkin juga akan memungkinkan model -model itu untuk “beralasan dari kerangka waktu yang lebih lama dan menangani hal -hal lebih koheren dalam jangka waktu yang lama,” kata Hershey. Model masa depan akan meningkat dengan menjadi “sedikit lebih baik dalam mengingat, melacak serangkaian yang koheren dari apa yang perlu mencoba membuat kemajuan,” tambahnya.

Twitch Chat merespons dengan banjir emoji yang memantul saat Claude menyimpulkan pelarian epik 78+ jam dari Mt Moon Pokémon.

Twitch Chat merespons dengan banjir emoji yang memantul saat Claude menyimpulkan pelarian epik 78+ jam dari Mt Moon Pokémon.


Kredit: Claude memainkan Pokemon / Twitch

Apa pun yang Anda pikirkan tentang peningkatan yang akan datang dalam model AI, kinerja Claude saat ini di Pokémon tidak membuatnya tampak seperti siap untuk mengantarkan ledakan kecerdasan buatan tingkat manusia yang sepenuhnya digeneralisasikan. Dan Hershey memungkinkan bahwa menonton Claude 3.7 sonnet terjebak di Mt. Moon selama 80 jam atau lebih dapat membuatnya “tampak seperti model yang tidak tahu apa yang dilakukannya.”

Tapi Hershey masih terkesan dengan cara bahwa model penalaran baru Claude kadang -kadang akan menunjukkan sedikit kesadaran dan “semacam mengatakan bahwa itu tidak tahu apa yang dilakukan dan tahu bahwa itu perlu melakukan sesuatu yang berbeda. Dan perbedaan antara 'tidak bisa melakukannya sama sekali' dan 'dapat melakukannya' adalah hal yang cukup besar untuk hal -hal Ai ini,” lanjutnya. “Kamu tahu, ketika sesuatu bisa melakukan sesuatu yang biasanya berarti kita cukup dekat untuk membuatnya bisa melakukan sesuatu dengan sangat baik.”