Post AYIIYUeY4nVCiiGnzs by opny721@mastodon.uno
(DIR) More posts by opny721@mastodon.uno
(DIR) Post #AYDfKX3leqLDHmZudc by quinta@mastodon.uno
2023-07-30T12:08:32Z
0 likes, 0 repeats
Universal and Transferable Attacks on Aligned Language Models https://blog.quintarelli.it/2023/07/universal-and-transferable-attacks-on-aligned-language-models/
(DIR) Post #AYDgjZ55NbbWkSh9qS by ilcomizietto@mastodon.uno
2023-07-30T12:24:16Z
0 likes, 1 repeats
@quinta - Ergo sono infinitamente manipolabili nonostante filtri, blocchi e paletti imposti dai programmatori delle IA? Molto affascinante.
(DIR) Post #AYDlWhfCesWbNBH7ku by FedeRinaldi83@mastodon.uno
2023-07-30T13:17:57Z
0 likes, 1 repeats
@quinta in effetti è molto interessante, potrebbe anche, a lungo andare, spegnere l’hype che hanno generato fino ad ora
(DIR) Post #AYEDB52jqmbSEGlGpU by opny721@mastodon.uno
2023-07-30T18:27:48Z
0 likes, 0 repeats
@quinta un modo potrebbe essere passare l'output ad un altro modello LLM che ne comprende il significato e valuta se può farlo passare.
(DIR) Post #AYEF833mxzoP7Ow0jA by quinta@mastodon.uno
2023-07-30T18:49:40Z
0 likes, 0 repeats
@opny721 il problema è proprio che non comprendonosolo giustappongono simboli (che noi leggiamo come parole)
(DIR) Post #AYIIYUeY4nVCiiGnzs by opny721@mastodon.uno
2023-08-01T17:46:53Z
0 likes, 1 repeats
@quinta si e credo non riescano a reinterpretare quello che generano mentre lo fanno. In pratica non pensa prima di parlare :)
(DIR) Post #AYJWYywt1wqhCHw0Uy by quinta@mastodon.uno
2023-08-02T07:58:34Z
0 likes, 0 repeats
@opny721 non pensa...
(DIR) Post #AYJaaucoTcFCBPimau by mora@mastodon.uno
2023-08-02T08:43:44Z
0 likes, 0 repeats
@quinta @opny721 In pratica sono della Signora Mia molto veloci e con una base di stringhe molto prossima a quella del PQM – Portiere Quadratico Medio.