AI 스스로 성능 개선 우려, 앤트로픽 전 세계에 AI 개발 일시 중단 호소

가오산(高杉)

【정견뉴스】

사진은 예시도. 2025년 5월 16일 촬영, 화면 속에는 한 휴대전화 화면 위의 인공지능(AI) 로고가 표시되어 있다. (올렉시 피소소니 /영문 에포크타임스)

미국 샌프란시스코에 본사를 둔 인공지능(AI) 기업 앤트로픽(Anthropic)이 목요일(6월 4일) 글을 발표해 전 세계 주요 AI 연구소들에 최첨단 AI 시스템 개발을 속도 조절하거나 일시 중단할 것을 고려하라고 촉구했다. 또한 AI가 인간의 개입이 거의 없는 상태에서 스스로 성능을 향상하는 ‘재귀적 자기 개선’ 능력에 점차 가까워지고 있으며, 이는 사회에 중대한 위험을 초래할 수 있다고 경고했다.

앤트로픽, AI 위험성 고조 경고

앤트로픽이 발표한 글에 따르면, 회사 연구진은 전 세계가 ‘프런티어(첨단) AI 개발을 속도 조절하거나 일시적으로 중단’할 수 있다면 사회적 거버넌스와 안전 연구가 기술 발전 속도를 따라잡는 데 도움이 될 것이라고 보았다.

이 글은 앤트로픽 연구소의 책임자인 마리나 파바로(Marina Favaro)와 회사의 공동 창립자인 잭 클라크(Jack Clark)가 공동으로 집필했다.

글에서는 현재 인공지능 모델의 능력 발전 속도가 매우 빠르며, 인공지능이 대규모의 인간 개입 없이도 스스로 시스템을 최적화하고 업그레이드할 수 있는 ‘재귀적 자기 개선(Recursive Self-Improvement)’ 방향으로 나아가고 있다고 지적했다.

이 메커니즘은 AI가 인간 지능의 문턱을 넘어 ‘지능 폭발’을 일으키는 핵심 열쇠로 간주되어 왔으며, 이미 구글 딥마인드(Google DeepMind)와 앤트로픽 등 최고 패권 연구소들의 연구개발 중점이 되었다.

앤트로픽 측은 현재 실제로 이러한 상황이 나타난 것은 아니지만, 그 도래가 “대부분의 정부와 기관이 예측하는 것보다 더 빠를 수 있다”고 밝혔다.

회사는 “기존의 증거들은 인공지능 개발 과정의 매 단계마다 인간의 역할이 계속해서 축소되고 있음을 보여준다”고 지적했다.

앤트로픽은 또한 전 세계적으로 AI 개발 중단을 진정으로 실현하려면 미국과 중국 등 주요 인공지능 국가와 일련의 거대 IT 기업들이 공동으로 참여해야 하며, 이와 동시에 검증 가능한 감독 시스템을 구축해야 한다고 제안했다.

앤트로픽의 주장, 논란 불러일으켜

앤트로픽은 최근 몇 년간 클로드(Claude) 시리즈 인공지능 모델을 출시하며 빠르게 부상했고, 오픈AI(OpenAI) 등 기업과의 경쟁 속에서 시장의 주목을 받아왔다.

언론 보도에 따르면, 앤트로픽은 최근 새로운 투자 유치를 마무리 지었으며 회사 기업가치는 1조 달러에 육박하고 비공개로 상장 절차에 착수했다.

그러나 이 회사가 장기간 인공지능 안전 문제를 강조해 온 점은 업계에서 논란을 낳기도 했다.

벤처 투자자이자 트럼프 정부의 비공식 고문인 대빅 삭스(David Sacks)는 앤트로픽이 표면적으로는 ‘안전’을 명분으로 내세우지만, 실제로는 규제를 통해 경쟁사들의 발전을 제한하려는 의도라고 비판한 바 있다.

일부 비판론자들은 앤트로픽이 자사의 최신 AI 모델에 잠재적인 안전 위험이 존재함을 반복해서 강조하는 것이 일종의 마케팅 효과를 노린 것이라고 지적하기도 한다.

앤트로픽은 2026년 4월, 가장 선진적이면서도 베일에 싸인 프리뷰 버전 모델인 ‘클로드 미토스(Claude Mythos 또는 Mythos Preview)’를 출시했다. 이 모델은 매우 강력하고 보안 자문 업계를 깜짝 놀라게 할 만한 자율적 네트워크 보안 능력을 보여주었다.

테스트 결과 클로드 미토스는 여러 개의 ‘제로데이 취약점(Zero-day Vulnerabilities)’을 자율적으로 발견하고 연계할 수 있는 것으로 확인되었으며, 보안 취약점을 발굴하고 이용하는 능력이 기존의 AI 모델(클로드 4.6 오푸스 등)을 훨씬 뛰어넘었다. 심지어 주요 운영체제(OS)와 브라우저에서 수십 년 동안 숨겨져 있어 인간 전문가와 자동화 도구조차 발견하지 못했던 시스템 보안 취약점을 찾아내기도 했다.

해당 모델이 해커들에 의해 무기화될 경우 재앙적인 사이버 공격을 유발할 수 있다는 우려 때문에, 앤트로픽은 미토스를 대중에 공개하는 것을 거부했다.

대신 그들은 엄격히 제한된 폐쇄적 출시 전략을 채택하여, ‘프로젝트 글래스윙(Project Glasswing)’이라는 계획을 통해 마이크로소프트, 애플, 아마존, 크라우드스트라이크, 유럽연합 사이버보안청(ENISA) 등 소수의(초기 약 40~50개사, 이후 2026년 6월 기준 약 150개사로 확대) 특정 대형 IT 기업, 보안 기관 및 주요 인프라 연합에만 방어 목적의 취약점 보완용으로 제공했다.

앤트로픽의 이러한 행보는 일부 전문가들 사이에서 자사의 기술력을 과시하는 한 가지 방식으로 해석되기도 했다.

업계, AI 미래 두고 여전히 이견 존재

현재 인공지능 업계에서는 AI가 ‘인공일반지능(AGI)’에 이미 가까워졌는지 여부를 두고 거대한 이견이 존재한다. AGI란 인간의 지능 수준에 근접하거나 이를 갖추고, 혹은 뛰어넘는 이론적 시스템으로, 인간이 완수할 수 있는 어떤 지적 임무든 이해하고 학습하여 수행할 수 있는 AI 시스템을 말한다.

인공지능 분야의 저명한 학자이자 메타 플랫폼스(Meta Platforms)의 전 수석 인공지능 과학자인 얀 르쿤(Yann LeCun)은 기존의 거대언어모델(LLM)이 인간의 지능 수준에 진정으로 도달하기는 어렵다고 밝혔다. 그는 이전에 현재 인공지능의 지능 정도는 ‘고양이 수준’에 더 가까우며 인간에는 훨씬 미치지 못한다고 비유한 바 있다.

그러나 앤트로픽의 최고경영자(CEO) 다리오 아모데이(Dario Amodei)는 인공지능이 사회적 불평등을 심화시킬 수 있으며, 심지어 수많은 초급 화이트칼라 일자리를 대체할 수 있다고 거듭 경고했다.

앤트로픽 측은 향후 수개월 동안 정책 입안자, 연구원 및 기타 인공지능 기업들과 논의를 전개하여 인공지능의 급격한 발전이 가져올 위험에 대응하기 위한 글로벌 조율 메커니즘 구축을 연구할 예정이라고 밝혔다.

（에포크타임스에서 전재）

원문위치: https://www.zhengjian.org/node/302932