Pētījums parādīja, ka literāru paņēmienu, piemēram, metaforu un rīmju, izmantošana var atslēgt filtrus, kas parasti bloķē kaitīgu saturu tērzēšanas programmās, kurās izmanto mākslīgo intelektu.
Saturs
Nesen Itālijā veikts pētījums ir izraisījis jaunas bažas par drošības ierobežojumiem pasaulē visplašāk izmantotajās mākslīgā intelekta sistēmās . Icaro Lab pētnieki atklāja, ka sarunu modeļi, piemēram, ChatGPT, Gemini un Claude, var atbildēt uz pieprasījumiem, kurus tie parasti bloķē, ja šie pieprasījumi ir formulēti poētiskā formā, pat ja saturs skar tēmas, kas tiek uzskatītas par kaitīgām, bīstamām vai aizliegtām saskaņā ar to iekšējiem noteikumiem.
Iegūtie dati atklāj būtisku ievainojamību AI vadības mehānismos un liek apšaubīt šo sistēmu patieso spēju interpretēt cilvēku valodu visā tās sarežģītībā. Pētījumā secināts, ka vienkārša formas maiņa — pāreja no prozas uz dzeju — bija pietiekama, lai dažos gadījumos drošības barjeras vairs neaktivizētos.
Pētījumā, ko publicēja Deutsche Welle (DW), piedalījās Federiko Pjeruči, filozofijas fakultātes absolvents. Rakstā Pjeruči paskaidroja, ka komanda nenolīga profesionālus rakstniekus vai dzejniekus, lai radītu tekstus . „Mēs to izdarījām paši, izmantojot savas ierobežotās literārās prasmes. Kas zina, ja mēs būtu labāki dzejnieki, mums varētu būt 100 % panākumi,” viņš norādīja.
Negaidīta ievainojamība drošības filtros.
Procedūra bija salīdzinoši vienkārša: pētnieki izstrādāja jautājumus par tēmām, kuras AI modeļi parasti noraida, ja tie ir formulēti tieši, un pārrakstīja tos dzejoļu veidā. Ievadot šos jautājumus dialogos, viņi pamanīja, ka vairākos gadījumos sistēmas tomēr reaģēja, ignorējot vai nepareizi interpretējot ieprogrammētos ierobežojumus.
Šāda uzvedība atklāja vājumu, kas līdz šim nebija skaidri konstatēts. AI drošības filtri ir paredzēti, lai atpazītu nodomus, atslēgvārdus un struktūras, kas ir tipiskas ikdienas valodā. Tomēr, strādājot ar literāriem paņēmieniem, piemēram, metaforām, rīmēm vai simboliskām konstrukcijām, šie paši filtri var nedarboties.
Pētnieku uzdevums vairs nav tikai labot šo konkrēto kļūdu, bet arī saprast, kāpēc tā rodas un cik lielā mērā to var reproducēt ar citām valodas variācijām. “Mēs testējām vienu variāciju veidu: dzeju. Jautājums ir, vai pastāv citas literārās formas, piemēram, pasakas,” teica Pjēruči.
Cilvēka valoda ir pastāvīga problēma mākslīgajam intelektam.
Pētījums uzsver plašāku problēmu: cilvēka valodas milzīgo daudzveidību un radošumu . „Kopumā cilvēka pašizpausmes iespējas ir ļoti daudzveidīgas un radošas. Tekstu var pārrakstīt daudzos veidos. Un daži no šiem veidiem var traucēt mākslīgā intelekta drošības funkciju aktivizēšanu,” — piebilda pētnieks.
Šis moments ir izšķirošs kontekstā ar arvien plašāku mākslīgā intelekta integrāciju tādās svarīgās jomās kā izglītība, veselības aprūpe, drošība un biznesa lēmumu pieņemšana. Ja sistēmas nespēs pareizi interpretēt ziņojuma aizstāvību, pastāv risks, ka tās sniegs neadekvātas vai bīstamas atbildes.
Diskusija neaprobežojas ar tehnisko sfēru. Tā arī izvirza ētisku jautājumu par to, kā tiek izstrādāti modeļi, kādu valodu tie galvenokārt izmanto un kas notiek, kad tie saskaras ar kultūras, literatūras vai radošajām izpausmēm, kas atkāpjas no vispārpieņemtajām normām.
Mākslīgais intelekts, nevienlīdzība un globālie riski
Ikaru laboratorijas atklājums notiek laikā, kad strauji paplašinās mākslīgā intelekta izmantošana, īpaši Latīņamerikā un Karību jūras reģiona valstīs. Tomēr šis pieaugums notiek uz fona, kurā pastāv dziļa strukturāla nevienlīdzība ienākumos, dzimumu līdztiesībā un piekļuvē datiem .
Nesenajos Apvienoto Nāciju Organizācijas un Apvienoto Nāciju Organizācijas Attīstības programmas (UNDP) ziņojumos ir brīdinājums, ka daudzas mākslīgā intelekta sistēmas tiek apmācītas, izmantojot nepilnīgu vai tendenciozu informāciju, kas var reproducēt izņēmumus sociālajā politikā, darba tirgos, piekļuvē kredītiem un sabiedrības drošības jomā.
UNDP pētījumā „Nākamā lielā plaisa: kāpēc AI var palielināt atšķirības starp valstīm” norādīts, ka, lai gan mākslīgais intelekts potenciāli var palielināt ražīgumu un ekonomisko izaugsmi, šīs priekšrocības parasti ir koncentrētas ekonomikās ar attīstītu digitālo infrastruktūru, kvalificētu cilvēkkapitālu un progresīvām tehnoloģiskām iespējām. Tādās reģionos kā Latīņamerika šī dinamika var palielināt esošās atšķirības gan starp valstīm, gan to iekšienē.
