Suurin osa LLM-palveluista saadaan antamaan vaarallisia vastauksia varsin helposti

Written by

Esikatselukuva

Tutkijat kehittivät tavan "murtaa" LLM:t ohjeistamaan laittomuuksiin ja muihin epäeettisiin käyttötapoihin kuten rahanpesuun ja pommien tekemiseen, mistä ne normaaleissa käyttötapauksissa kieltäytyisivät.

Suurin osa LLM-palveluista saadaan antamaan vaarallisia vastauksia varsin helposti. Tutkijat kehittivät tavan "murtaa" LLM:t ohjeistamaan laittomuuksiin ja muihin epäeettisiin käyttötapoihin kuten rahanpesuun ja pommien tekemiseen, mistä ne normaaleissa käyttötapauksissa kieltäytyisivät.

Kun huolestuneet tutkijat ottivat yhteyttä johtaviin kielimallipalveluiden tarjoajiin, he eivät saaneet vastakaikua. Moni yrityksistä jätti kokonaan vastaamatta, kun taas osa ilmoitti, ettei moiset murtamiset kuulu kyseisten yritysten haavoittuvuuksien paljastamisesta palkitsevien ohjelmien piiriin.

Ote artikkelista: Researchers say threat from ‘jailbroken’ chatbots trained to churn out illegal information is ‘tangible and concerning’

Linkki artikkeliin

Suurin osa LLM-palveluista saadaan antamaan vaarallisia vastauksia varsin helposti

More posts

Yhdysvalloissa datakeskusten lähellä asuvien sähkölaskut ovat nousseet jopa 267% viiden vuoden takaiseen verrattuna

Nyt myös OpenAI:n tutkijat myöntävät, että kielimallien ”hallusinoinnit” ovat matemaattisesti vääjäämättömiä

Tutkimus: DeepSeekin koulutuskustannukset arvioituakin alhaisemmat

Mario Draghi haluaa laittaa EU:n tekoälyasetuksen osittain tauolle