Constitutional AI

Anthropic'in Claude'u eğitirken kullandığı, kurallara dayalı güvenlik yaklaşımı.

Neden Önemli?

RLHF'ye ek olarak yazılı ilkelerle modelin davranışını şekillendirme yöntemi.