안녕하세요! 아침마다 AI 뉴스를 보다 보면, OpenAI와 챗GPT는 늘 ‘기준점’처럼 서 있었습니다. 새로운 모델이 나올 때마다 “GPT보다 좋은가?”가 자동으로 따라붙었고요.

그런데 최근 판도가 눈에 띄게 흔들리고 있습니다. 구글의 제미나이 3, 중국발 오픈소스 모델들, 그리고 조용히 몸집을 키운 앤스로픽까지 — 더 이상 AI 왕좌가 한 회사의 전유물은 아니라는 신호들이 곳곳에서 보입니다. 이번 글에서는 그 변화의 한가운데에 선 OpenAI가 왜 ‘코드 레드’를 걸었는지, 그리고 왕좌에서 언더독으로 내려온 지금 어떤 시험대에 올라서 있는지를 함께 짚어보려고 합니다.

OpenAI, 처음 서 보는 2위 자리

news-34

이미지 출처: Google

지난 3년 동안 생성형 AI의 상징은 단연 OpenAI와 ChatGPT였습니다.

그러나 제미나이 3 프로가 공개되면서 공기가 달라졌습니다. 주요 벤치마크에서 GPT-5.1을 밀어내고 상단을 차지한 제미나이는, 단순한 점수 역전을 넘어 “AI 왕좌의 주인이 바뀔 수 있다”는 현실감을 시장에 심었습니다.

지금의 OpenAI는 처음으로 언더독의 위치에 서 있습니다.

구글, 메타처럼 긴 시간 동안 흥망을 겪으며 위기관리 근육을 키워온 빅테크와 달리, OpenAI는 거의 곧바로 ‘세계에서 가장 빠르게 성장한 소비자 제품’의 주인공이 됐습니다.

덕분에 왕좌에 오르는 법은 누구보다 잘 알지만, 왕좌에서 미끄러질 때 어떻게 버티고 다시 올라가야 하는지는 아직 검증되지 않았습니다. 이번 ‘코드 레드’는 그 첫 시험대입니다.

쿨한 척, 하지만 결국 코드 레드 🚨

news-34

이미지 출처: deepmind

제미나이 3 프로가 공개된 직후, 샘 올트먼은 사내 메모에서 구글의 성과를 인정하면서도 “결국 승자는 초지능(ASI)에 먼저 도달하는 곳”이라며 장기 비전을 강조했습니다. 시선을 당장의 벤치마크가 아닌 더 먼 미래로 돌리려는, 겉보기엔 여유로운 대응이었습니다.

하지만 그 여유는 오래가지 않았습니다. 12월 1일, OpenAI는 내부적으로 ‘코드 레드(Code Red)’를 선포합니다. 회사의 존망이 걸린 분기점으로 이번 상황을 규정하고, 아래의 내용에 모든 역량을 집중하라는 지시가 내려졌습니다.

  • ChatGPT의 속도 향상
  • 안정성 강화
  • 개인화 수준 제고
  • 질문 커버리지 확장

광고, 쇼핑 에이전트, 헬스케어 도구, 영상 생성 모델 SORA 같은 ‘멀티 트랙’ 프로젝트들은 일제히 브레이크가 걸렸습니다.

흥미로운 대목은 내부 메모에 경쟁 모델인 ‘Gemini’라는 이름이 직접 명시됐다는 점입니다.

경쟁사의 존재를 굳이 말로 설명하지 않아도 됐던 시절은 끝났고, “우리가 지금 누구와 싸우는지”를 직원들에게 일일이 상기시켜야 하는 단계에 들어섰다는 방증입니다.

3년 전 구글이 울린 같은 비상벨

아이러니하게도, 이 장면은 정확히 3년 전의 구글을 떠올리게 합니다.

2022년 말, ChatGPT의 등장을 본 구글은 검색 패러다임이 바뀔 수 있다고 판단해 ‘코드 레드’를 선언했습니다. 창업자까지 다시 호출해 급히 내놓은 카드가 바로 ‘바드(Bard)’였습니다.

news-34

이미지 출처: investing.com

결과는 좋지 않았습니다. 첫 시연 영상에서부터 오답을 내는 바람에 신뢰를 잃었고, 시장의 실망은 주가 하락으로 직결됐습니다. 누구도 못 넘을 것 같던 검색 공룡이 다급하게 발을 헛디디는 모습은, OpenAI를 일약 스타덤으로 올려놓은 사건이기도 했습니다.

지금의 OpenAI는 그때의 구글과 여러모로 겹쳐 보입니다.

코드 레드를 선언한 뒤 나오는 대응들이 ‘우리가 기준이다’라는 태도라기보다는, ‘우리도 저 정도는 한다’는 반응형 전략에 가깝게 읽히기 때문입니다.

GPT-5.2 조기 등판설이 주는 메시지

가장 상징적인 변화는 차기 모델의 출시 타이밍입니다. 해외 매체를 통해 OpenAI가 GPT-5.2 출시를 앞당길 것이라는 보도가 이어지고 있습니다.

지금까지 OpenAI는 시장의 소음과 무관하게 자신들만의 기술 로드맵과 안전 기준을 우선시하는 ‘마이웨이’ 전략을 고수해 왔습니다. 경쟁사가 무엇을 내놓든, 결국 더 나은 것을 차분히 내놓을 수 있다는 자신감이 브랜드의 일부였습니다.

하지만 제미나이 3가 호평을 받자마자 예정에 없던 차기 모델 소식이 흘러나온 것은, 기존의 태도와 결이 다릅니다. 정말로 준비가 끝났기 때문일 수도 있지만, 빼앗긴 스포트라이트를 되찾기 위해 일정을 앞으로 당기는 ‘속도전’으로도 해석됩니다.

준비되지 않은 바드를 서둘러 무대에 올렸다가 데미지를 입은 3년 전 구글의 선택이 자연스럽게 겹칩니다.

선도자가 쓰던 문법인 “우리가 기준이다” 대신, 추격자의 문법인 “우리도 뒤처지지 않았다”는 메시지가 앞에 서기 시작한 셈입니다.

어설픈 ‘생산성 리포트’가 남긴 뒷맛

조급함이 묻어나는 또 다른 장면은 OpenAI가 발표한 ‘기업 AI 현황(The state of enterprise AI)’ 리포트입니다. “직장인의 하루 업무 시간이 평균 1시간 줄었다”는 요지는, 겉으로 보기엔 AI 거품론을 반박하기 위한 자료처럼 보입니다.

news-34

이미지 출처: the-state-of-enterprise-ai_2025-report (of OpenAI)

하지만 보고서를 뜯어보면, 설문 응답자의 ‘자기 보고(Self-report)’에 과도하게 의존하고 있고, 실제 산출물의 품질, 검증·수정에 들어가는 시간 등 숨은 비용은 제대로 반영되지 않았습니다.

AI가 초안을 빠르게 써줘서 1시간 아꼈다고 느낄 수 있지만, 그 초안을 검증하고 고치는 데 2시간을 쓴다면 실질 생산성은 마이너스입니다.

최근 학계와 업계에서 지적하는 ‘워크슬롭(Workslop, 그럴듯하지만 부실한 결과물)’ 문제를 정면으로 다루지 않은 채 “느낌” 위주로 생산성을 포장했다는 비판이 나오는 이유입니다.

무엇보다 타이밍이 미묘합니다. 경쟁사의 기술적 도약이 주목받는 찰나에 나온, 데이터 설계가 허술한 리포트는 “우리 기술은 여전히 유용하다”는 메시지를 급하게 증명하려는 방어 기제로 읽히기 쉽습니다.

3년 전 구글이 검색 우위를 방어하려 애쓰며 설득력 떨어지는 논리를 펼쳤던 장면이 데자뷔처럼 겹칩니다.

구글도 힘든데… 중국도?

구글 제미나이도 나와 힘든데, 경기장 위에는 또다른 경쟁자들이 올라와 있습니다. 바로 중국의 오픈 소스 모델들입니다.

딥시크, 큐웬(Qwen) 같은 오픈소스 모델로 실리콘밸리 개발자 생태계를 잠식하고 있습니다. 허깅페이스에서 큐웬 모델 다운로드 수는 라마(LLaMA)를 넘어섰고, 새로 등장하는 오픈소스 LLM 상당수가 큐웬 파생 모델입니다.

비용과 개방성, 빠른 출시 주기를 무기로 한 중국식 전략은 “비싸고 폐쇄적인 미국 모델”에 대한 현실적인 대안이 되고 있습니다.

알리바바가 평균 20일 주기로 새 모델을 공개하고 있다는 사실은, 기술 그 자체보다 실험 속도와 배포 속도가 얼마나 중요해졌는지 상징적으로 보여줍니다.

이런 와중에 가만히 미소 짓고 있는 앤스로픽

news-34

이미지 출처: anthropic

그리고 또 하나의 축이 바로 앤스로픽(Anthropic)입니다. 오픈AI와 비슷한 시기에 출발해 LLM을 만들고 있지만, 전략은 극명하게 다릅니다.

앤스로픽의 CEO 다리오 아모데이는 OpenAI의 코드 레드와 관련해 “우리는 코드 레드 같은 거 안 한다. 그럴 필요가 없다. 우리는 다른 길을 가고 있다”고 말했습니다. 말 그대로 “속도전에 휘둘리지 않겠다”는 선언입니다.

이 자신감의 배경에는 대표적으로 세 가지의 명확한 사업 구조가 있습니다.

  • B2B·엔터프라이즈 중심 모델: 대중용 챗봇보다는 기업용 API, 문서 작성, 코딩 등 텍스트 기반 생산성 영역에 집중
  • 선택과 집중: 영상·로봇·브라우저·광고 등으로 확장하는 대신, 텍스트 LLM 자체의 품질과 안정성에 자원을 모음
  • 비용 구조의 효율성: 오픈AI가 2028년까지 2,350억 달러 규모의 R&D·운영비를 계획하는 반면, 앤스로픽은 700억 달러 수준을 예상함

서버(하드웨어) 비용 비중도 크게 다릅니다. 예상치 기준으로 2027년 오픈AI는 매출의 절반 이상을 서버에 쓸 것으로 보이지만, 앤스로픽은 30% 언저리에서 관리할 수 있을 것으로 관측됩니다.

2028년에도 이 차이는 이어져 오픈AI는 40%, 앤트로픽은 22% 수준이 될 것으로 보입니다.

결과적으로 앤트로픽은 2028년에 손익분기점에 도달할 가능성이 크고, 오픈AI는 2030년까지 적자를 이어갈 것으로 전망됩니다.

“누가 더 똑똑한가”에서 “누가 돈을 버는가”로

불과 몇 년 전만 해도 AI 담론의 중심에는 “누가 더 강력한 모델을 만들었는가”가 있었습니다.
OpenAI는 그 시기, “상상력에 투자한다”는 슬로건을 내세워 막대한 자본을 끌어모았습니다.

하지만 지금의 화두는 조금 달라졌습니다.

누가 이 기술을 실제로 유료화할 수 있는가?, 누가 장기적으로 지속 가능한 비즈니스를 만들 수 있는가?, 누가 서버·칩·전력 비용을 견디면서, 동시에 신뢰할 수 있는 서비스를 제공할 수 있는가?로 좁혀질 것 입니다.

HSBC와 도이치뱅크는 OpenAI의 자금 구조를 놓고 경고를 날렸습니다. ChatGPT 사용자가 몇 배로 늘고, 유료 전환율이 10%까지 올라가더라도 향후 4년간 2,000억 달러(약 260조 원) 추가 자금이 필요할 수 있다는 추정입니다.

OpenAI는 데이터 센터 구축 예산만 1조 4,000억 달러에 이르는데, 현재 연 매출은 200억 달러 수준에 머물러 있습니다.

이는 이제 AI가 기술 경쟁을 넘어, 자본과 인프라의 체력 싸움 단계에 진입했음을 보여줍니다.

왕관을 쓴 자에게 필요한 것은 더 똑똑한 모델뿐 아니라, 더 단단한 재무 구조와 사업 모델입니다.

마무리

경쟁은 사용자 입장에서 꽤 반갑기도 합니다.

더 빠르고, 더 영리하고, 더 다양한 선택지를 가진 AI를 쓸 수 있게 되니까요.

결국 기업들의 치열한 격돌은 사용자에게 품질 개선과 선택권 확장이라는 형태로 돌아옵니다. 다만 그 속도가 너무 빨라질 때, 우리가 무엇을 놓치고 있는지 돌아보는 일은 여전히 중요합니다.

기술이 인간을 위한 것이라면, 신뢰·안전·투명성은 속도보다 앞서는 기준이어야 합니다.

시장 점유율을 조금 더 가져오기 위한 조급함이, 이 기준을 희미하게 만들 때 진짜 문제가 시작됩니다.

지금 같은 시기에 필요한 건, “다음 모델이 얼마나 더 똑똑해질까?”보다 “이 기술이 어디를 향해야 하는가?”에 대한 질문을 해야할 때인 것 같습니다.

댓글남기기