TopicTracker
来自 HackerNews查看原文
译文语言译文语言

默认对齐?

本文探讨了人工智能系统是否能够通过设计实现"默认对齐",即系统在无需额外干预的情况下自然与人类价值观保持一致。作者分析了当前对齐研究的挑战,并提出了通过架构和训练方法实现默认对齐的可能性。

相关报道