译文语言

现代大语言模型能否准确数出"blueberry"中有多少个字母"b"？

这是一个针对大语言模型的对抗性问题，但并非不公平的测试。文章探讨了现代LLM在处理看似简单的计数任务时面临的挑战，揭示了模型在基本推理能力方面的局限性。