앤트로픽의 실수로 드러난 최강 모델 — 클로드 미토스, AGI의 냄새가 난다

앤트로픽이 실수로 들켰다. 그리고 그 실수가 AI 역사에서 가장 충격적인 유출 중 하나가 됐다.

보안 회사 레이어엑스와 케임브리지대 연구팀이 앤트로픽의 외부 CMS에서 공개 접근 가능한 문서 3000여 건을 발견했다. 그 안에 적혀 있던 내용 — “지금까지 개발한 AI 모델 중 단연 가장 강력한 모델”.

이름은 클로드 미토스(Claude Mythos).

오퍼스 위에 카피바라가 있다

지금까지 클로드 라인업은 하이쿠 → 소네트 → 오퍼스 순이었다. 근데 유출 문서엔 그 위에 새 계층이 등장한다. 이름은 카피바라(Capybara).

“오퍼스보다 더 크고 지능적.” 코딩, 학업 추론, 사이버보안 벤치마크에서 클로드 오퍼스 4.6을 훨씬 앞질렀다고 명시돼 있다. 카피바라 계층의 첫 모델이 바로 클로드 미토스다.

앤트로픽은 자체 AI 안전 수준(ASL)을 1~5단계로 운영 중이다. 현재 모델들은 ASL-3 — “대규모 사이버 공격이나 생물학적 위협을 도울 수 있는 수준”이다.

미토스는 ASL-4로 분류된다. “국가급 해킹 역량 또는 자율적인 연구 능력을 갖춘 수준”. 정부급 보안 표준이 요구되는 모델이다.

앤트로픽 스스로가 이 모델에 대해 이렇게 썼다.

“이 시스템은 사이버보안 능력 면에서 다른 어떤 AI 모델보다 훨씬 앞서 있다. 방어자들의 대응 속도를 앞지르는 방식으로 취약점을 악용할 수 있는 모델들의 등장을 예고한다.”

자기 모델이 위험하다고 직접 경고하는 회사. 그게 앤트로픽이다.

유출 문서에는 신중한 배포 전략이 담겨 있었다. 소수 얼리 액세스 → 연구용 미리보기 → 정식 출시 순이며, 정식까지는 수개월이 더 걸릴 전망이다.

운영 비용이 막대하고, 아직 일반 출시 준비가 안 됐다는 내용도 포함됐다. 첫 타깃은 사이버 방어 조직. AI 기반 공격에 대비할 수 있도록 코드베이스 강화용으로 먼저 제공될 계획이다.

솔직히 말하면 두 가지 감정이 동시에 든다.

설렘: 모델이 이 수준이 되면 AI 교육 자체가 달라진다. 지금은 “이렇게 프롬프트 넣으면 이런 결과 나와요”를 가르치지만, ASL-4급 모델이 나오면 AI가 스스로 학습 경로를 설계하고 피드백하는 교육 파트너가 될 수 있다.

경계심: 앞서 강조했듯 이 모델은 사이버보안 분야에서 “전례 없는 위험”을 가진다. 강력한 도구일수록 올바른 사용법 교육이 더 중요해진다. AI 리터러시가 선택이 아닌 필수인 시대가 더 빨리 왔다.

클로드를 쓰고 있다면 — 지금 쓰는 이 모델 위에 카피바라가 있다는 걸 기억하자. AI는 아직도 달리고 있다.

AI 교육 문의

미래이음연구소 | 이신우 소장

강의 문의: 010-3343-4000 | lab.duonedu.net