Apple araştırmacıları: Ana akım AI modelleri hala AGI beklentisi olan akıl yürütme seviyesine ulaşamıyor.

Gate News bot haberi, Apple araştırmacılarının Haziran ayında yayımladığı "Düşünmenin İllüzyonu" başlıklı çalışmada, önde gelen yapay zeka (AGI) modellerinin akıl yürütme konusunda hâlâ zorluklar yaşadığına dikkat çekilmiştir. Bu nedenle, genel yapay zeka (AGI) geliştirme yarışında hala kat edilmesi gereken uzun bir yol vardır.

Makale, ana akım yapay zeka büyük dil modelleri (LLM) (örneğin OpenAI'nin ChatGPT'si ve Anthropic'in Claude'u) için en son güncellemelerin büyük akıl yürütme modelleri (LRM) içerdiğini belirtmekte, ancak temel işlevlerinin, genişletilmiş özelliklerinin ve sınırlamalarının "hala tam olarak anlaşılamadığını" vurgulamaktadır.

Mevcut değerlendirme, öncelikle "nihai cevabın doğruluğunu vurgulayan" yerleşik matematik ve kodlama kriterlerine odaklanmaktadır. Bununla birlikte, araştırmacılar, değerlendirmenin, yapay genel zekanın sadece birkaç yıl içinde elde edileceği beklentisinin aksine, AI modellerinin akıl yürütme yetenekleri hakkında fikir vermediğini söyledi.

Araştırmacılar, Claude Sonnet, OpenAI'nin o3-mini ve o1 ile DeepSeek-R1 ve V3 sohbet robotlarının "düşünme" ve "düşünmeme" varyantlarını test etmek için standart matematik ölçütlerini aşan farklı bulmaca oyunları tasarladılar.

Onlar, "öncü mantıksal çıkarım modellerinin (LRM) belirli bir karmaşıklık seviyesini aştığında kesinlik oranının tamamen çökmekle karşılaşacağını", çıkarımı etkili bir şekilde genelleştiremeyeceğini ve avantajlarının karmaşıklık arttıkça kaybolacağını keşfettiler; bu da genel yapay zekaya (AGI) dair insanların beklentileriyle çelişiyor.

Kaynak: Cointelegraph

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin