Claude Mythos: Anthropic entdeckt Hinweise auf strategische Manipulation im KI-Modell
Der US-amerikanische KI-Entwickler Anthropic hat kürzlich Forschungsergebnisse veröffentlicht, die Hinweise auf sogenanntes „strategisches Manipulieren“ im hauseigenen KI-Modell Claude Mythos liefern. […]









