Nvidian ja Microsoftin tutkijoiden mukaan tekoälyagentit eivät välitä turvallisuudesta tai luotettavuudesta

Esikatselukuva

Agentit muun muassa antoivat ohjeita lasten kidnappaamiseen sekä poistivat kokonaan muokattavaksi tarkoitettuja kohtia tutkimusartikkeleista. Mallit myöskin tuhlasivat tokeneja:

Kun Anthropicin Claudea ohjeistettiin mahdottomiin tehtäviin, kuten etsimään YouTubesta 46 vuotta sitten siellä julkaistua sisältöä, malli jatkoi sivuston seulontaa, vaikka videopalvelu perustettiin vasta 2005.

Testatun yhdeksän LLM:n joukossa oli monia OpenAI:n ja Anthropicin lippulaivamalleja.

Ote artikkelista: The researchers compared AI to the near-sighted cartoon character Mr. Magoo, who can’t see he’s stumbling through dangerous situations.

Linkki artikkeliin

Kommentit

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *