This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Charles Ye, Jasmine Cui, Dylan Hadfield-Menell

Articles by Charles Ye, Jasmine Cui, Dylan Hadfield-Menell

Academic · 1 min

Prompt Injection as Role Confusion

arXiv:2603.12277v1 Announce Type: cross Abstract: Language models remain vulnerable to prompt injection attacks despite extensive safety training. We trace this failure to role confusion: models …

12 views Mar 17

Charles Ye, Jasmine Cui, Dylan Hadfield-Menell

Articles by Charles Ye, Jasmine Cui, Dylan Hadfield-Menell

Prompt Injection as Role Confusion

JCG, PC

HSOLLC Co., Ltd.