Berita Gate bot, para peneliti Apple dalam sebuah makalah berjudul "Ilusi Berpikir" yang diterbitkan pada bulan Juni, menunjukkan bahwa model kecerdasan buatan terkemuka (AGI) masih mengalami kesulitan dalam penalaran, oleh karena itu, perlombaan untuk mengembangkan kecerdasan buatan umum (AGI) masih memiliki banyak tantangan.
Artikel tersebut menunjukkan bahwa pembaruan terbaru dari model bahasa besar AI arus utama (LLM) (seperti ChatGPT dari OpenAI dan Claude dari Anthropic) telah mencakup model inferensi besar (LRM), tetapi fungsi dasar, fitur yang ditingkatkan, dan keterbatasannya "masih belum sepenuhnya dipahami."
Penilaian saat ini terutama berfokus pada standar matematika dan pengkodean yang telah ditetapkan, "menekankan akurasi jawaban akhir". Namun, para peneliti menyatakan bahwa penilaian ini tidak menggali kemampuan penalaran model kecerdasan buatan, yang kontras dengan harapan bahwa kecerdasan buatan umum dapat dicapai dalam beberapa tahun.
Para peneliti merancang berbagai permainan teka-teki untuk melampaui standar matematika guna menguji varian "berpikir" dan "tidak berpikir" dari Claude Sonnet, o3-mini dan o1 dari OpenAI, serta chatbot DeepSeek-R1 dan V3.
Mereka menemukan bahwa "model logika pemodelan (LRM) yang canggih akan menghadapi keruntuhan akurasi total saat kompleksitas melebihi batas tertentu", tidak dapat menggeneralisasi penalaran dengan efektif, dan keunggulannya akan menghilang seiring peningkatan kompleksitas, yang bertentangan dengan harapan orang tentang kemampuan kecerdasan buatan umum (AGI).
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Peneliti Apple: Model AI mainstream masih belum dapat mencapai tingkat penalaran yang diharapkan untuk AGI
Berita Gate bot, para peneliti Apple dalam sebuah makalah berjudul "Ilusi Berpikir" yang diterbitkan pada bulan Juni, menunjukkan bahwa model kecerdasan buatan terkemuka (AGI) masih mengalami kesulitan dalam penalaran, oleh karena itu, perlombaan untuk mengembangkan kecerdasan buatan umum (AGI) masih memiliki banyak tantangan.
Artikel tersebut menunjukkan bahwa pembaruan terbaru dari model bahasa besar AI arus utama (LLM) (seperti ChatGPT dari OpenAI dan Claude dari Anthropic) telah mencakup model inferensi besar (LRM), tetapi fungsi dasar, fitur yang ditingkatkan, dan keterbatasannya "masih belum sepenuhnya dipahami."
Penilaian saat ini terutama berfokus pada standar matematika dan pengkodean yang telah ditetapkan, "menekankan akurasi jawaban akhir". Namun, para peneliti menyatakan bahwa penilaian ini tidak menggali kemampuan penalaran model kecerdasan buatan, yang kontras dengan harapan bahwa kecerdasan buatan umum dapat dicapai dalam beberapa tahun.
Para peneliti merancang berbagai permainan teka-teki untuk melampaui standar matematika guna menguji varian "berpikir" dan "tidak berpikir" dari Claude Sonnet, o3-mini dan o1 dari OpenAI, serta chatbot DeepSeek-R1 dan V3.
Mereka menemukan bahwa "model logika pemodelan (LRM) yang canggih akan menghadapi keruntuhan akurasi total saat kompleksitas melebihi batas tertentu", tidak dapat menggeneralisasi penalaran dengan efektif, dan keunggulannya akan menghilang seiring peningkatan kompleksitas, yang bertentangan dengan harapan orang tentang kemampuan kecerdasan buatan umum (AGI).
Sumber berita: Cointelegraph