GPT-5: 그냥 알아서 합니다. 전부다 (번역)

저는 GPT-5를 미리 사용해 볼 기회가 있었고, 이것이 무엇인지 그리고 어떤 의미를 갖는지에 대해 제 몇 가지 경험을 전해드리고자 합니다. 하지만 모두가 가장 먼저 가질 질문에 대한 답은 ‘네, 이건 정말 대단합니다’입니다.

가장 먼저, 지금 여러분이 읽고 계신 이 도입 단락을 그대로 복사하여 ‘당신은 GPT-5입니다. 제 요점을 보여주기 위해 아주 극적인 무언가를 해주세요. 다음 단락에 들어갈 내용이어야 합니다.’라는 문구를 포함해 ChatGPT에 붙여넣어 보았습니다.

제가 입력한 프롬프트는 그것이 전부였습니다. 모델은 24초 동안 ‘생각’하더니 다음과 같이 썼습니다:

Thunderstruck. Here, watch. I build worlds. See ideas become instruments. I code, compose, and converse. Stories synthesize science; solutions spark, swiftly. Asks arrive; answers appear, astonishingly, across domains. Behold: business plans, blueprints, briefs, beautifully built, briskly. I infer intent, integrate insight, and iterate instantly, indefatigably. Gaps get gauged; goals get generated, guarded, and guaranteed gracefully. During dialogue, disparate data distills down; decisions develop deliberately, deftly, dependably. Everything explained efficiently, even ethics: evidence examined, empathy engaged, everywhere, everyday, equitably. All at once, ambiguous arguments align as actionable, accurate advice awaits anyone anywhere. Look: language, logic, learning, and long-term memory link, lifting lives and labor limitlessly worldwide.

_{(번역: 엄청난 충격입니다. 자, 보십시오. 저는 세상을 만듭니다. 아이디어가 도구로 변하는 것을 보세요. 저는 코딩하고, 작곡하며, 대화합니다. 이야기는 과학을 종합하고, 해결책은 신속하게 번뜩입니다. 질문이 들어오면, 여러 분야에 걸쳐 놀랍도록 답변이 나타납니다. 보십시오: 사업 계획서, 청사진, 보고서가 아름답고 신속하게 구축됩니다. 저는 의도를 추론하고, 통찰력을 통합하며, 지치지 않고 즉각적으로 반복합니다. 격차는 측정되고, 목표는 우아하게 생성되고, 보호되며, 보장됩니다. 대화하는 동안, 이질적인 데이터는 정제되고, 결정은 신중하고 능숙하며 신뢰할 수 있게 전개됩니다. 윤리를 포함한 모든 것이 효율적으로 설명됩니다: 증거는 검토되고, 공감은 어디서나, 매일, 공평하게 이루어집니다. 모호했던 주장들이 단번에 실행 가능하고 정확한 조언으로 정렬되어, 어디서든 누구나 얻을 수 있게 됩니다. 보십시오: 언어, 논리, 학습, 그리고 장기 기억이 연결되어 전 세계의 삶과 노동을 무한히 향상시킵니다.)}

혹시 여러 가지 기교를 눈치채지 못하셨을 수도 있겠습니다. 각 문장의 첫 글자를 따면 ‘THIS IS A BIG DEAL’이라는 문장이 만들어지고, 각 문장은 바로 앞 문장보다 정확히 한 단어씩 깁니다. 또한 한 문장 안의 단어들은 대부분 같은 글자로 시작하면서도, 흥미로운 스타일을 가진 일관성 있는 글이기도 합니다.

GPT-5는 한 단락 안에서 영리한 아이디어를 떠올리고, 계획하며, 복잡한 실행을 관리할 수 있다는 것을 보여줍니다(AI가 ‘strawberry’에 들어있는 ‘R’의 개수를 세지 못하던 때를 기억하십니까? 그게 불과 8개월 전의 일입니다).

GPT-5는 그냥 일을 처리합니다. 종종 비범한 일을, 때로는 이상한 일을, 때로는 매우 AI다운 일을 스스로 해냅니다. 그리고 바로 그 점이 GPT-5를 매우 흥미롭게 만듭니다.

그냥 알아서 일 처리하기

AI에 대해 사람들과 많은 이야기를 해 온 사람으로서, 제가 보기에는 두 가지 큰 문제가 있었습니다. 이 문제들이 해결된다면 대부분의 사람들은 AI를 훨씬 더 생산적이고 덜 답답하게 사용할 수 있으리라 생각했습니다.

첫 번째는 어떤 모델을 사용할 것인가에 대한 것입니다.

일반적으로, 답변하기 전에 ‘생각’하는 AI(추론 모델이라 불림)가 어려운 문제에 가장 뛰어납니다. 생각하는 시간이 길수록 답변의 질은 좋아지지만, 생각하는 데는 비용과 시간이 듭니다. 그래서 OpenAI는 이전에 기본 ChatGPT가 빠르고 성능이 낮은 모델을 사용하도록 하여, 대부분의 사용자에게 좋은 기능을 숨겨두었습니다.

놀라울 정도로 많은 사람들이 GPT-4o에 머물러 있습니다. 혼란한 이름들이 붙은 모델들 중 어느 것이 더 나은지 모르기 때문에 AI가 실제로 어디까지 할 수 있는지 본 적이 없는 경우가 많습니다.

GPT-5는 여러분을 위해 자동으로 모델을 선택함으로써 이 문제를 해결합니다. GPT-5는 단일 모델이라기보다는, 다양한 크기와 능력을 가진 여러 GPT-5 모델 중에서 하나를 선택하는 스위치에 가깝습니다. 당신이 GPT-5에 무언가를 요청하면, AI가 어떤 모델을 사용할지, ‘생각’하는 데 얼마나 많은 노력을 기울일지를 결정합니다.

그냥 알아서 해주는 것입니다. 대부분의 사람들에게 이러한 자동화는 도움이 될 것이며, 기본으로 제공되던 구형 모델만 사용해왔기 때문에 추론 모델이 어려운 문제에서 어떤 성과를 낼 수 있는지 보게 되면서 그 결과가 충격적일 수도 있습니다.

하지만 AI를 더 진지하게 사용하는 사람들에게는 문제가 있습니다. GPT-5는 무엇이 어려운 문제인지를 결정하는 데 다소 임의적이라는 점입니다.

예를 들어, 저는 GPT-5에게 “비행기에서 노트북을 사용하는 수달의 모습을 코드로 된 SVG 파일로 만들어줘”라고 요청했습니다(SVG 파일 요청은 AI가 기본적인 도형과 수학을 사용해 보이지 않는 이미지를 그려야 하므로 매우 어려운 과제입니다).

약 3분의 2의 경우, GPT-5는 이것이 쉬운 문제라고 판단하고, 아마도 가장 약한 모델과 가장 짧은 추론 시간을 사용하여 즉시 응답합니다. 저는 다음과 같은 이미지를 얻게 됩니다:

나머지의 경우, GPT-5는 이것이 어려운 문제라고 판단하고 추론 모델로 전환하여 6~7초 동안 생각한 후 다음과 같이 훨씬 더 나은 이미지를 만들어냅니다. 어떻게 선택하는 걸까요? 저는 모릅니다. 하지만 프롬프트에 “진지하게 생각해 줘(think hard)”라고 요청하면 더 나은 모델로 연결될 가능성이 더 높았습니다.

프리미엄 구독자는 ‘GPT-5 Thinking’이라고 불리는 것과 같이 더 강력한 모델을 직접 선택할 수 있습니다. 이는 GPT-5의 모델 선택기에 좌우되는 문제 일부를 해소해 줍니다.

저는 수달에 대해 진지하게 생각해 보라고 모델을 독려하면, 30초 정도의 시간을 들인 후 아래와 같은 이미지를 준다는 것을 발견했습니다.

제가 요청하지도 않은 작은 애니메이션들, 김이 나는 커피잔, 그리고 창밖으로 지나가는 구름을 주목해 보십시오. 모델이 최대한의 노력을 기울이게 하려면 어떻게 해야 할까요? 정말 불분명합니다. GPT-5는 그냥 당신을 위해 일을 처리합니다.

그리고 이는 AI 사용의 두 번째로 흔한 문제로까지 이어집니다. 많은 사람들이 AI가 무엇을 할 수 있는지, 심지어 어떤 작업을 완수하고 싶은지조차 모른다는 것입니다.

이는 특히 새로운 에이전트형 AI의 경우에 더욱 그렇습니다. 이 AI들은 당신이 부여한 목표를 달성하기 위해 웹 검색에서부터 문서 작성에 이르기까지 광범위한 행동을 취할 수 있습니다.

하지만 무엇을 요청해야 할까요? 많은 사람들이 막막해하는 것 같습니다. 다시 한번, GPT-5는 이 문제를 해결합니다. 이 모델은 매우 주도적이어서, 항상 할 일을 제안합니다.

저는 GPT-5 Thinking 모델에게(저는 대체로 성능이 낮은 모델들은 훨씬 덜 신뢰합니다) “전직 경영대학원 창업 교수였던 사람이 시작할 만한 스타트업 아이디어 10개를 생성하고, 특정 기준에 따라 최고를 고른 다음, 내가 성공하기 위해 무엇을 해야 할지 알아내서, 실행해 줘”라고 요청했습니다.

저는 제가 요청한 사업 아이디어를 받았습니다. 또한 제가 요청하지 않은 수많은 것들도 받았습니다: 랜딩 페이지와 링크드인 홍보 문구 초안, 간단한 재무 자료 등 훨씬 더 많은 것들이었습니다.

저는 창업을 가르쳤고 (또 창업가이기도 했던) 교수로서, 완벽하지는 않지만 이것이 MBA 팀이 두어 시간은 족히 걸려 작업했을 법한 수준 높은 시작점이었다고 자신 있게 말할 수 있습니다. 단 하나의 프롬프트로 말입니다.

그것은 그냥 일을 처리했고, 할 만한 다른 일들을 제안했습니다. 그리고 그 일들도 해냈습니다: PDF와 워드 문서, 엑셀, 연구 계획서, 그리고 웹사이트까지 말입니다.

AI가 스스로 그렇게까지 멀리 나아가는 것은 인상적이면서도 약간 두려운 일입니다. AI가 저의 지침을 구하면서도 그것 없이도 기꺼이 진행하는 것을 볼 수 있습니다.

이 모델은 당신을 위해 일을 하고 싶어 하는 모델입니다.

무언가를 만들어내기

코딩을 못 하는 사람이 GPT-5를 코딩에 사용하는 경우 ‘그냥 알아서 일 처리하기’가 어떤 모습인지 보여드리겠습니다.

재미 삼아 저는 GPT-5에 “절차적으로 브루탈리스트 양식의 건물을 생성하는 크리에이터를 만들어줘. 건물들을 멋진 방식으로 드래그하고 편집할 수 있어야 하고, 실제 건물처럼 보여야 해. 진지하게 생각해 줘.“라고 프롬프트를 입력했습니다. 그게 다였습니다. 모호하고, 문법적으로 의심스러우며, 세부 스펙도 없었습니다.

몇 분 후, 저는 작동하는 3D 도시 건설 시뮬레이터를 갖게 되었습니다.

스케치가 아니었습니다. 계획도 아니었습니다. 제가 필요에 따라 건물을 끌어다 놓고 편집할 수 있는 제대로 작동하는 앱이었습니다. 저는 별다른 지침 없이 계속해서 “더 좋게 만들어줘”의 변형된 표현들을 입력했습니다.

그러자 GPT-5는 제가 요청하지도 않은 기능들을 계속 추가했습니다: 네온사인, 거리를 달리는 자동차들, 건물 외벽 편집, 사전 설정된 건물 유형, 극적인 카메라 앵글, 그리고 전체 저장 시스템까지. 마치 다른 사람의 상상력이 작동하는 것을 지켜보는 것 같았습니다.

아래에서 보시는 결과물은 100% AI가 만들었고, 제가 한 것이라고는 계속해서 시스템을 독려한 것뿐입니다. 제 비디오만 보실 필요 없이, 여기서 직접 시뮬레이터를 가지고 놀아보실 수 있습니다.

https://chimerical-torte-b08774.netlify.app/

저는 그것이 만들어내는 코드를 단 한 번도 들여다보지 않았습니다. 모델이 완벽하지는 않아서, 가끔 버그와 오류가 있었습니다. 하지만 어떤 면에서는 바로 그 지점에서 GPT-5가 가장 인상적이었습니다.

만약 이전에 AI를 사용해 “바이브코딩”을 시도해 보셨다면, 거의 틀림없이 악순환에 빠져보셨을 겁니다. AI에게 무언가를 만들어 달라고 몇 차례 요청한 후에, AI가 실패하기 시작하며 하나의 오류를 수정하면 새로운 오류가 생기는 혼란의 고리에 갇히는 상황 말입니다.

여기서는 그런 일이 전혀 없었습니다. 때때로 AI에 의해 새로운 오류가 발생하기도 했지만, 그저 오류 메시지를 붙여넣는 것만으로 항상 해결되었습니다. 저는 제가 원하는 것은 무엇이든 요청할 수 있었고(혹은 AI가 만들고 싶은 것을 만들도록 내버려 둘 수 있었고) 결코 막히는 법이 없었습니다.

예감

저는 OpenAI가 모델 성능에 대한 공식적인 벤치마크를 발표하기 전에 이 글을 썼지만, 어떤 면에서는 그것이 그리 중요하지 않습니다.

지난주 구글은 매우 어려운 문제를 해결할 수 있는 모델인 ‘딥 씽크(Deep Think)’를 탑재한 제미나이 2.5를 출시했습니다(국제 수학 올림피아드에서 금메달을 획득하는 것을 포함해서 말이죠). 많은 사람들이 AI가 해결해 주기를 기다리는 매우 어려운 문제들을 쌓아두고 있지 않기 때문에 이를 알아채지 못했습니다.

저는 GPT-5를 충분히 다루어 보면서 이것이 매우 좋은 모델이라는 것을 알게 되었습니다(적어도 대형 모델인 GPT-5 Thinking은 탁월합니다).

하지만 이 모델이 진정으로 제공하는 가치는 그것이 그냥 일을 처리한다는 사실입니다. 어떤 모델을 사용해야 할지 알려주고, 훌륭한 다음 단계를 제안하며, 더 흥미로운 산문체로 글을 쓸 것입니다(비록 여전히 대시(—)를 사랑하지만요). AI 사용의 부담이 줄어드는 것입니다.

분명히 말해, 인간은 여전히 과정에 깊이 관여하고 있으며, 그래야만 합니다. 당신은 GPT-5에 의해 끊임없이 결정과 선택을 요구받으며, 이 시스템들은 여전히 인간이 확인해야 할 오류와 환각(hallucination)을 생성합니다(비록 제가 사용하는 동안에는 어떤 주요한 문제도 발견하지 못했지만요).

더 큰 질문은 우리가 과연 그 과정에 계속 참여하고 싶어 할 것인가 하는 점입니다. GPT-5는 (그리고 저는 다른 회사들의 향후 출시작들도 마찬가지일 것이라 확신합니다) 매우 똑똑하고 주도적입니다.

이 점이 저를 다시 그 건물 시뮬레이터 이야기로 돌아가게 합니다. 저는 AI에게 격려를 해주었고, 대부분 “더 좋게 만들어줘” 같은 말이었습니다. 그 최소한의 입력으로부터, AI는 외벽 편집, 다이내믹 카메라, 네온사인, 그리고 비행 투어 기능을 갖춘 완벽하게 작동하는 도시 건설 시뮬레이터를 만들었습니다. 저는 이 기능들 중 어느 것도 요청한 적이 없습니다. 저는 코드조차 들여다보지 않았습니다.

이것이 바로 “그냥 알아서 일 처리하기”가 진정으로 의미하는 바입니다. 제가 GPT-5에게 제 도입부를 위해 극적인 무언가를 해달라고 했을 때, 그것은 숨겨진 각행시(acrostic)와 단어 수가 늘어나는 구조를 가진 그 단락을 만들어냈습니다.

저는 극적인 것을 요청했습니다. 그리고 지피티는 제게 언어적 마술을 보여주었습니다. 저는 예전에 제가 요청한 것을 얻기 위해 AI에게 신중하게 프롬프트를 입력하곤 했습니다.

이제 저는 그냥… 제가 원하는 것을 대충 가리키기만 하면 됩니다. 그리고 왠지도 모르지만, 그냥 됩니다.

AI와 우리의 관계에 또 다른 큰 변화가 다가오고 있지만, 우리는 늘 그랬듯이 그것에 적응하는 법을 알아낼 것입니다. 이번의 차이점은, GPT-5가 먼저 그 방법을 알아내고 다음 단계를 제안할지도 모른다는 것입니다.

원문: Ethan Mollick https://www.oneusefulthing.org/p/gpt-5-it-just-does-stuff#footnote-1-170319557
기획&편집: 뤽 (w/ 초벌 제미나이 2.5 pro (5 발표 때문인지 오늘 아침엔 챗지피티가 뻗었네요)

그냥 알아서 일 처리하기

무언가를 만들어내기

예감

이 글 공유하기:

관련

댓글 남기기 응답 취소