머신러닝/AI의 확산 (번역)

2012년 정도까지는 테크 업계의 사람들에게 뉴럴 네트워크가 무엇인지 물어본들 제대로 된 답이 없었을 것입니다. 제대로 동작하지도 않던 80년대 즈음의 아이디어 정도를 대답했겠죠. VR이라든지 말이죠. 그러다 2013년에 나타난 이미지넷(Imagenet)은 뉴럴 네트워크가 동작할 수도 있다는 사실을 알게해준 강렬한 계기였습니다. (2013년의 VR도 그랬고요)

이후 테크 업계는 매해 머신러닝의 역사를 새로 써내려가고 있습니다. 한편에서는 ‘구글은 모든 데이터를 소유하게 될 것이고, 중국은 모든 AI를 갖게 될 것이다’라는 안일한 전망도 있습니다만, 요즘 (머신러닝이) 얼마나 다양한 모습으로 확산(deployment)되고 있는지를 관찰해보는 것은 아주 흥미롭습니다.


1단계: 플랫폼 레이어 (기반기술의 태동)

1단계는 플랫폼 레이어에서 시작한 회사들이었습니다. 엄밀히는 플랫폼이라기보다 이미지 인식, 음성 인식, 감정 분석처럼 기본적인 머신러닝 솔루션을 위해 만들어진 핵심 기술 혹은 기반 기술이라 볼 수 있겠습니다.

이들 중 일부는 성장하는데 성공했지만, 대부분은 아마존 AWS, 구글 클라우드, 마이크로소프트 애저처럼 스토리지와 DB, 클라우드 컴퓨팅까지 모든 원천 기술을 제공하는 공룡 기업들에게 잠식당하고 말았습니다. 


2단계: 묻지마 머신러닝 (기존 문제의 개선)

2단계 국면에 들어서며, 거의 모든 테크 회사들은 머신러닝을 일단 꺼내들고 그들의 제품이나 서비스 중 어디에 활용될 수 있는지 찾기 시작했습니다. 망치를 들면 모든 문제가 못처럼 생각하게 된다는 농담처럼, 테크 업계는 모두가 (머신러닝이라는) 망치를 들고는 어떤 문제가 AI에 관련한건지, 아니 AI와 관련했다고 볼 수 있는지 따지고 들기 시작했습니다. 

크게 볼 때 뭐 얼추 맞는 말입니다. 에버로우(a16z의 포트폴리오) 같은 회사는 머신러닝을 활용한 감정의 분석이나 유사 문장 검색과 같은 기능을 그들의 제품에 (어쩌면 과다하게) 포함했습니다. 보안 회사들은 머신러닝을 활용해 이상 징후를 발견하기도 하지만 그게 전부는 아닙니다. 스마트폰으로 사진을 찍어서 텍스트를 추출해내는 경우, 머신러닝이 활용되기는 하지만 (AI라기보다는) 그냥 텍스트 추출에 불과합니다.

물론 스마트폰 카메라가 물리적으로 하드웨어 이미지 센서를 쓰는 만큼 광의의 머신러닝 기기라고도 볼 수도 있습니다. 즉, (2단계란) 머신러닝이라 하는 것이 이미 존재하는 회사들이나 제품들에 이미 보이지 않게 흡수되는 것이었죠.


3단계: 애플리케이션 (새로운 문제의 해결)

3단계가 열리며, 문제를 완전히 새로운 방식으로 풀기 위한 머신러닝을 사용하는 회사들이 파도처럼 몰려오기 시작했습니다. 피플.AI는 자연어 처리 기술을 활용해서 세일즈포스에서 오가는 텍스트를 분석하여 고객 관리 파이프라인 중 어디가 잘못되고 있는지를 감지합니다.

디스크립트(Descript)가 제공하는 음성 인식 기술은 음성의 파형을 따지 않더라도 텍스트 에디터로 사람들의 대화내용을 편집할 수 있게 해주죠. 이들은 여느 AI회사와 같다 보기도 어렵습니다. 구체적인 문제를 해결해주는, 앱을 가지고 있는 회사들이기 때문이죠. 

디스크립트는 라디오 PD에게 “우리 제품을 사용하시면 여러분이 매일 겪는 수고로움을 덜 수 있습니다”라고 말하지 BBC 본사 같은 곳을 찾아가 “우리의 ‘AI’ 기술이 여러분의 사업을 완전히 혁신할 수 있습니다”라고 말하지 않습니다.

이런 회사들은 특정 산업에 국한되지 않습니다. 심지어 머신러닝이나 AI와 관련이 있을거라 생각조차 못했던, 아주 구체적인 문제들을 머신러닝으로 멋지게 해결합니다. 영상 이슈가 아니라고 생각했던 문제를 영상 분석 머신러닝을 이용해 푼다든지, 음성 이슈가 아니라 생각된 무언가를 푸는데 음성 인식 기술을 사용한다든지 하는 경우는 생각보다 많습니다.

이제 이런 회사들이 모든 것을 스스로 다 만들 필요가 없다는 점이 중요합니다. 머신러닝 기반 음성 인식 모듈이 AWS, 구글 클라우드, 애저에 흡수된 사실이 의미하는 것은, 디스크립트 같은 회사는 그냥 그걸 활용해서 그 위에서 돌아가는 제품을 만들어내기만 하면 된다는 뜻입니다. 마치 AWS에 스토리지 관련 솔루션이 포함된 이후, 스타트업들이 더 이상 제품을 출시하기 전에 스토리지 어레이를 자체적으로 구현하는데 수백만 불을 쓰지 않게 된 것과 마찬가지입니다.

인프라 역할을 하는 테크 공룡들의 솔루션이 성장하면서 더 많은 써드파티 회사들이 생겨날 수 있게 되었습니다. 머신러닝/AI 분야라고 예외는 아니죠. 우리는 거인의 어깨 위에 올라탄 것과 마찬가지입니다. 음성 인식에 대한 원천기술을 개발해서 플랫폼으로 AWS와 경쟁하려는 것이 좋은 생각이 아니듯, AWS 역시 디스크립트(와 같은 구체적인 제품)를 만들지는 않을 것입니다. 


4단계: non-테크 산업의 혁신 (모든 산업의 디폴트)

4단계에 들어서면서 머신러닝과 같은 기술들은 테크 업계를 넘어서 확산되고 있습니다. a16z에서는 대기업들과 투자사와의 만남을 주선하고 스타트업 업계에서 어떤 일들이 일어나는지 알려주는 시간을 갖는데, 요즘엔 머신러닝과 AI에 관련한 것들이 많습니다. 

최근 기억에 남는 사례로, 한 제조업체가 생산 공정 중간에 특정 유형의 불량을 감지하고자 하는 이슈가 있었습니다. 그 동안 이걸 자동화시킬 수 없었습니다만, 이제는 스마트폰용 센서가 장착된 스틱을 생산 라인에 설치하고 이를 뉴럴네트워크에 연결해서 불량/정상을 감지해낼 수 있게 되었다고 합니다.

구글은 이런 아이디어를 생각하지 않습니다. 중국의 업체들도 마찬가지고요. 이 솔루션은 아웃소싱 컨설팅을 하는 회사가 만든 것이었습니다. 이런 건 구글 정도의 공룡이 하는 아주 어려운 기술이라기보다는, (구체적인 문제를 해결하는) 하나의 소프트웨어 제품일 뿐이니까요.

물론 이 분야도 많은 이들이 들어오면서 어느 정도 역할은 나눠지고 있습니다. Drishti는 스틱에 달린 카메라를 생산하고 원격측정, 수치화, 통계분석을 하나의 완결된 솔루션으로 만듭니다. 이건 컴퓨터비전일까요 머신러닝일까요 아니면 솔루션 최적화일까요? (물론 구글 같은 곳이 이런 걸 할 일이 없다는 건 당연하지만요)


새로운 기술이 배포되는 것에는 늘 사이클이 있습니다. 종종 저는 머신러닝을 RDB(관계형 데이터베이스)와 비교하곤 합니다. RDB는 40년 전 쯤 굉장히 놀랍고 흥미진진한 아이디어였습니다. 이제는 모든 대기업이 수십 수백 개의 DB를 여러 공급자로부터 받아서 쓰고 있죠. 이들 중 일부는 무척 정교합니다. 기업이 자체적으로 DB를 구성하기도 하죠. 산업에 따라 특화되기도 하고 경쟁사들이 동일한 DB 솔루션을 쓰기도 합니다.

지금 일어나는 일들을 좀 더 거시적인 시야로 바라본다면 도움이 될 것입니다. 실리콘밸리에서 종종 이야기하는 것 중 하나는 ‘다음의 빅 띵이 무엇일까’ 하는 것입니다. PC가 있었고, 인터넷이 도래했으며 그 뒤 스마트폰이 생겨났죠. 이제 스마트폰은 진부할 정도로 친숙해졌습니다. 그렇다면 그 다음 로켓은 무엇일까요? 

종종 머신러닝과 블록체인이라 이야기합니다만, 제가 보기에는 더 큰 차원의 시계열로 볼 필요가 있습니다. 지난 수십 년 동안 우리는 데이터베이스, 업무생산성, 클라이어트-서버 앱, 오픈소스, SaaS, 클라우드라는 거대한 트렌드들을 거쳐왔습니다. 클라이언트 플랫폼이 달라졌고, 새로운 소프트웨어 아키텍쳐와 개발 모델들이 생겨났습니다. 바로 이것이 우리가 머신러닝을 바라보아야 하는 관점입니다.

머신러닝은 마치 새로운 SQL이라 볼 수 있습니다. (블록체인은 새로운 오픈소스라 볼 수 있겠죠) 그러니 ‘우리의 AI 전략은 무엇입니까?’ 라거나 ‘우리는 어떤 AI 업체를 써야 할까요?’는 좋은 질문이 아닙니다.

이런 것들을 생각해야하는 거죠.
우리의 클라우드 서비스나 SaaS는 무엇이고 어떻게 골랐었죠?
우리는 데이터베이스를 어떻게 써서 무슨 기회를 잡으려고 했던거죠? 

“제가 지금 회사에서 하고 있는 고민과 직접적으로 닿아있는 주제입니다.


흔히 머신러닝, AI 이야기할 때 기술적 시각에서 접근하기 쉽습니다. 하지만 비즈니스 관점에서의 용례에 주목한다는 점에서 훌륭한 사례가 많이 포함되어 있어서 비개발자가 읽기에도 나쁘지 않은 글입니다.


네 개의 단계로 구분지어 설명하는 흐름 전개가 좋았습니다. 제 판단엔 우리나라의 경우 사례가 늘어나고 있긴 하나 많은 회사들이 2단계 정도에 머물러 있는 게 아닌가 하는 생각이 들기도 하네요.”

번역자 배행크

댓글 남기기