TopicTracker
出典 garymarcus.substack.com原文を表示
翻訳言語翻訳言語

最先端モデルにおける視覚理解の幻影

モデルが「画像にアクセスすることなく標準的な胸部X線質問応答ベンチマークで最高ランクを達成」するとき、何かが根本的に間違っていることがわかります。これは現在のAIシステムにおける視覚理解能力の限界を示しています。