Tutkijat kehittivät tavan "murtaa" LLM:t ohjeistamaan laittomuuksiin ja muihin epäeettisiin käyttötapoihin kuten rahanpesuun ja pommien tekemiseen, mistä ne normaaleissa käyttötapauksissa kieltäytyisivät.
Suurin osa LLM-palveluista saadaan antamaan vaarallisia vastauksia varsin helposti. Tutkijat kehittivät tavan "murtaa" LLM:t ohjeistamaan laittomuuksiin ja muihin epäeettisiin käyttötapoihin kuten rahanpesuun ja pommien tekemiseen, mistä ne normaaleissa käyttötapauksissa kieltäytyisivät.
Kun huolestuneet tutkijat ottivat yhteyttä johtaviin kielimallipalveluiden tarjoajiin, he eivät saaneet vastakaikua. Moni yrityksistä jätti kokonaan vastaamatta, kun taas osa ilmoitti, ettei moiset murtamiset kuulu kyseisten yritysten haavoittuvuuksien paljastamisesta palkitsevien ohjelmien piiriin.
Ote artikkelista: Researchers say threat from ‘jailbroken’ chatbots trained to churn out illegal information is ‘tangible and concerning’