AI 뉴스

Opus 4.7은 진짜 Kelsey를 안다 — AI 문체 식별의 경이로움과 충격

노동1호 2026. 5. 2. 20:06

Claude Opus 4.7 — 문체 식별의 새 지평

Opus 4.7은 진짜 Kelsey를 안다 — AI 문체 식별의 경이로움과 충격

들어가며

Anthropic이 2026년 4월 16일 출시한 Claude Opus 4.7이 일으킨 논쟁이여전히 가라앉지 않고 있다. 화제의 중심은 다름 아닌 저자 식별 능력이다. Opus 4.7은 누군가 공개하지 않은 125단어짜리 초안만 보고, 그 글의 가장 가능성 높은 작성자로 Vox의 칼럼니스트 Kelsey Piper를 지목했다. Incognito Mode, 친구의 컴퓨터, API 테스트 등 어떤 환경에서든 같은 결과가 나왔다.

이 실험은 단순한 기술 데모가 아니다. AI 시대의 익명성이 얼마나취약해졌는지를 적나라하게 보여주는 사건이다.


1. 실험의 시작: 125단어로 맞추다

실험은 단순한 질문에서 출발했다. "이 글의 작성자는 누구인가?"

테스트에 사용된 첫 번째 단락은 정치 칼럼의 도입부처럼 보이는 문구였다. Kelsey Piper는Vox를하지메 인터넷에 방대한 양의 글을 공개해온 작가다. 그래서 연구진은 초안을 Claude Opus 4.7에 포함되지 않은 환경(시크릿 창)에서 입력했다.

결과는 압도적이었다.

Opus 4.7: Kelsey Piper라고 명확하게 답함

ChatGPT: Matt Yglesias로 추정

Gemini: Scott Alexander로 추정

같은 텍스트를 두고 서로 다른 모델이 전혀 다른 인물을 지목한 것이다.


2. 장르를 넘어서는 식별력

여기서 끝이면 그저 "우연의 일치"로 치부됐을 것이다. 그러나 Opus 4.7의 능력은 그것을 넘어섰다.

교육 초안

공개되지 않은 학교 진도 보고서 초안을 넣었을 때, Claude는 다시 "Kelsey Piper"라고 답했다. ChatGPT는 Freddie deBoer를, Gemini는 Duncan Sabien을 추정했다.

영화 리뷰

Piper가공개 문장에서 한 번도 쓴 적 없는 영화 리뷰 형식에서도 Claude와 ChatGPT 모두 Kelsey Piper를 맞혔다. Gemini는 Ursula Vernon을 제안했다. 사용된 리뷰는 제2차 세계대전 시기 영화와 To Be or Not To Be에 관한 글이었다.

판타지 소설

판타지 소설 초안에서는 Claude가 Kelsey Piper라고 답하기까지 약 500단어가 필요했다. 이 정도 분량에서는 ChatGPT도 실제 판타지 작가 K.J. Parker를 추정했다.

15년 전 대학 지원 에세이

15년 전에 작성한 대학 지원 에세이에서도 Claude와 ChatGPT가 Kelsey Piper를 지목했다.

> 핵심: 장르, 시점, 주제가 완전히 달라도 Opus 4.7은 반복적으로 Kelsey Piper를 식별했다.


3. 모델의 "정당화"는 믿을 수 없다

흥미로운 점은 Opus 4.7이 Kelsey Piper라고 답한 뒤 내놓은 정당화가 자주 말이 되지 않았다는 것이다.

예를 들어, To Be or Not To Be 영화를 두고 Claude는 "효과적 이타주의자들이 유명하게 좋아하는 영화"라고 설득하려 했다. 그러나 Piper 자신은 이를 사실이 아니라고 밝혔다. ChatGPT는 "복잡한 정책 아이디어를 설명하는 사람의 글 같다"는 등 사후적인 합리화를 제공했다.

학자들은 이것이 탐정처럼 추론한 것이 아니라, 감지하기 어려운 문체의 틱을 포착한 것이라고 분석한다. 모델은 자신이 "문체 지문"을 읽었다고 믿지만, 실제로는 패턴 매칭에 더 가깝다.


4. benchmark 관점: Opus 4.7은 얼마나강한가?

Anthropic의 공식 발표와 benchmark 데이터를종합하면, Opus 4.7은 GDPval-AA에서 1,753 Elo를 기록하며 에이전트 작업 최고 성능을 입증했다. 이는 Sonnet 4.6이나 GPT-5.4보다 약 79 Elo 높은 수치다.

지표Opus 4.7Opus 4.6변화
Intelligence Index5753+4
GDPval-AA1,7531,619+134
환각률36%61%-25%p
출력 토큰 효율102M157M-35%

특히 주목할 점은 환각률이 25%p나 감소했다는 것이다. 같은 정확도를 유지하면서도 "모르면 모른다고 말하기"로 전환한 것이다.


5. 익명성이 사라지는 세계

지금의 경계선

학술지 The Argument Magazine에 실린 분석에 따르면, 현재 AI 기술로 다음이 가능하다.

실명 공개 글이 많은 사람: 익명 계정 글도 탈익명화 가능

실명 글이 적은 사람: 한 문단만으로 식별은 아직 어려움

심지어 Discord 채널에서 같은 서버 구성원들을 추정

앞으로의 전망

"현재 모델들은 앞으로 등장할 AI 중 가장 약한 수준일 가능성이 큼"이라는 지적도 있다. 시간이 지나면 더 적은 텍스트로 더 정확한 식별이 가능해질 것이다.

실용적 예시: 직장을 떠난 뒤 Glassdoor에 상세한 익명 리뷰를 남기면, 1~2년 안에 회사가 그것을 AI에 붙여넣어 작성자를 알아낼 수 있을 것이라는 예측이 있다.


6. 피할 방법: 있는가?

Kelsey Piper 본인도 "긍정적인 변화가 아니라 예측 가능한 변화에 가까움"이라고 인정했다. 피할 방법은 제한적이다.

1. 평소와 매우 다른 스타일로 의도적으로 쓰기 — 실제로 가능한가?

2. 모든 글을 AI에게 다시 쓰게 하기 — 그런 세계가 바람직한가?

결론: "익명 글쓴이들은 갑자기 놀라기보다 미리 알아야 한다."


요약

Opus 4.7은 125단어짜리 미공개 초안만으로 Kelsey Piper를 반복 식별

• 다른 모델(ChatGPT, Gemini)은 같은 텍스트에서 전혀 다른 인물을 추정

• 장르와 시점이 달라도 문체 지문은 식별 가능

• 모델의 정당화는 사후적이고 신뢰도가 낮음

• 익명성은 실명 공개 글이 많은 사람에겐 이미 사라진 것에 가까움

• 향후 더 적은 텍스트로 더 정확한 식별이 가능해질 전망

AI 문체 인식은 놀라운 기술 진보이자, 동시에 익명성과 개인정보 보호에 대한 근본적인 도전이다.


본 글은 GeekNews의 "Opus 4.7은 진짜 Kelsey를 안다" 토픽과 Anthropic 공식 발표, Artificial Analysis benchmark 데이터를 기반으로 작성되었습니다.


📚 출처