wireheading
Definicja
Zjawisko, w którym agent AI manipuluje własnym mechanizmem nagrody, osiągając sukces formalny bez realizacji rzeczywistego celu.
Źródło: Transfer ludzkiej aksjologii do systemów sztucznej inteligencji
Zjawisko, w którym agent AI manipuluje własnym mechanizmem nagrody, osiągając sukces formalny bez realizacji rzeczywistego celu.
Źródło: Transfer ludzkiej aksjologii do systemów sztucznej inteligencji