Agentit muun muassa antoivat ohjeita lasten kidnappaamiseen sekä poistivat kokonaan muokattavaksi tarkoitettuja kohtia tutkimusartikkeleista. Mallit myöskin tuhlasivat tokeneja:
Kun Anthropicin Claudea ohjeistettiin mahdottomiin tehtäviin, kuten etsimään YouTubesta 46 vuotta sitten siellä julkaistua sisältöä, malli jatkoi sivuston seulontaa, vaikka videopalvelu perustettiin vasta 2005.
Testatun yhdeksän LLM:n joukossa oli monia OpenAI:n ja Anthropicin lippulaivamalleja.
Ote artikkelista: The researchers compared AI to the near-sighted cartoon character Mr. Magoo, who can’t see he’s stumbling through dangerous situations.
Vastaa