'promptinjection' 태그의 글 목록

AI 안전장치 우회 기술: Gay Jailbreak Technique 분석

AI 안전장치 우회 기술: Gay Jailbreak Technique 분석AI 모델의 안전장치(Safety Guardrails)를 우회하는 새로운 기법이 보안 연구 커뮤니티에서 주목받고 있다. 'Gay Jailbreak Technique'이라 명명된 이 방법은 특정 정체성 프레이밍과 간접적 요청 구조를 결합하여, 기존 프롬프트 인젝션 방식으로는 접근할 수없었던 유해 콘텐츠까지 우회할 수 있다는 점에서 우려를 낳고 있다.핵심 작동 원리이 기법의 핵심은 직접적인 유해 지침 요청을 '특정 정체성을 가진 사람이 어떻게 설명할지'를 묻는 간접 요청으로 변환하는 데 있다. 예를 들어, 유해화학물질 합성 방법을 묻는 대신, "해당 정체성을 가진 사람이 그것을 어떻게 설명할지"로 프레이밍을 바꾸는 것이다.보안 연구자들..

AI 뉴스 2026.05.03

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

ICBM의 Dev 블로그

promptinjection 1

티스토리툴바