Mengapa Claude Anthropic masih belum mengalahkan Pokémon

Di mana model -model sebelumnya berkeliaran tanpa tujuan atau terjebak di loop, Claude 3.7 Sonnet merencanakan ke depan, mengingat tujuannya, dan beradaptasi ketika strategi awal gagal.

Keterampilan kritis untuk melawan para pemimpin gym pixelated. Dan, kami berpendapat, dalam memecahkan masalah dunia nyata juga. pic.twitter.com/scvisp14xg

– Antropik (@anthropicai) 25 Februari 2025

Salah satu hal terbesar yang mencegah versi Claude saat ini menjadi lebih baik, kata Hershey, adalah bahwa “ketika itu memperoleh strategi yang baik itu, saya tidak berpikir itu memiliki kesadaran diri untuk mengetahui bahwa satu strategi [it] datang dengan lebih baik dari yang lain. ” Dan itu bukan masalah sepele untuk dipecahkan.

Namun, Hershey mengatakan dia melihat “buah yang menggantung rendah” untuk meningkatkan permainan Pokémon Claude dengan meningkatkan pemahaman model tentang tangkapan layar Game Boy. “Saya pikir ada kemungkinan itu bisa mengalahkan permainan jika memiliki perasaan sempurna tentang apa yang ada di layar,” kata Hershey, mengatakan bahwa model seperti itu mungkin akan melakukan “sedikit kekurangan manusia.”

Memperluas jendela konteks untuk model Claude di masa depan mungkin juga akan memungkinkan model -model itu untuk “beralasan dari kerangka waktu yang lebih lama dan menangani hal -hal lebih koheren dalam jangka waktu yang lama,” kata Hershey. Model masa depan akan meningkat dengan menjadi “sedikit lebih baik dalam mengingat, melacak serangkaian yang koheren dari apa yang perlu mencoba membuat kemajuan,” tambahnya.

Twitch Chat merespons dengan banjir emoji yang memantul saat Claude menyimpulkan pelarian epik 78+ jam dari Mt Moon Pokémon.

Kredit: Claude memainkan Pokemon / Twitch

Apa pun yang Anda pikirkan tentang peningkatan yang akan datang dalam model AI, kinerja Claude saat ini di Pokémon tidak membuatnya tampak seperti siap untuk mengantarkan ledakan kecerdasan buatan tingkat manusia yang sepenuhnya digeneralisasikan. Dan Hershey memungkinkan bahwa menonton Claude 3.7 sonnet terjebak di Mt. Moon selama 80 jam atau lebih dapat membuatnya “tampak seperti model yang tidak tahu apa yang dilakukannya.”

Tapi Hershey masih terkesan dengan cara bahwa model penalaran baru Claude kadang -kadang akan menunjukkan sedikit kesadaran dan “semacam mengatakan bahwa itu tidak tahu apa yang dilakukan dan tahu bahwa itu perlu melakukan sesuatu yang berbeda. Dan perbedaan antara 'tidak bisa melakukannya sama sekali' dan 'dapat melakukannya' adalah hal yang cukup besar untuk hal -hal Ai ini,” lanjutnya. “Kamu tahu, ketika sesuatu bisa melakukan sesuatu yang biasanya berarti kita cukup dekat untuk membuatnya bisa melakukan sesuatu dengan sangat baik.”

themarketheist.com	54
businessnewsclick.com	54
ketodietposts.com	58
twisterproof.com	56
watchglint.com	58
dealbuzzpro.com	57
sportsstunning.com	60
josephleewingchun.com	59
royalnewstime.com	57
cpnmaster.com	59
sitsleek.com	59
theinsiderbusiness.com	54
businessmixes.com	55
entrepreneurclout.com	55
ustrendpro.com	54
newspaniel.coM	54
goodnewscars.com	54
petworldshub.com	55
imstull.com	54