对AI进步的错位恐慌
本文剖析了METR最新的"时间跨度"图表所展示和未展示的内容。作者指出,外界对AI进展的过度恐慌源于对图表数据的误解。图表显示AI在完成某些任务所需时间上有所缩短,但这并不等同于AI已具备真正的自主能力或通用智能。文章呼吁理性看待AI发展,避免被片面的数据所误导。
本文剖析了METR最新的"时间跨度"图表所展示和未展示的内容。作者指出,外界对AI进展的过度恐慌源于对图表数据的误解。图表显示AI在完成某些任务所需时间上有所缩短,但这并不等同于AI已具备真正的自主能力或通用智能。文章呼吁理性看待AI发展,避免被片面的数据所误导。
METR's latest evaluation finds that Claude Mythos's 50% task horizon now exceeds 16 hours, making it increasingly difficult for current benchmarks to measure the model's capabilities accurately.