본문 바로가기

신기술과 인공지능/인공지능 뉴스

페이스북(Facebook)의 인공지능 – Facebook의 차세대 성장동력

페이스북(Facebook)의 인공지능 – Facebook의 차세대 성장동력

이미 페이스북에서 기계학습과 딥러닝 등 인공지능 기술이 적용돼 있다. 페이스북을 이용하면서 "번역보기" 버튼을 클릭했거나 댓글, 상태, 사진 등에서 친구이름 태그해보았다면 이미 페이스북의 인공지능(AI)과 상호 작용한 것이다.  

페이스북은 AI 분야에 많은 투자를 하고 있다. 이미 2013년부터 투자를 해 왔습니다. 향후 10 ~ 20년간 페이스북의 성공을 이끌 차세대 성장 동력을 찾는 과정에서 AI의 잠재력을 간파한 저커버그는 AI를 핵심 성장 동력으로 선정하고, 인재 영역과 함께 적극적인 투자를 시작했다.

하지만 아직은 인간의 뇌 신경세포의 정보 처리 방식을 모방한 인공 ‘신경망(neural network)’에 비하면 단순하고 기초적인 알고리즘에 불과하다. 

페이스북의 얀 르쿤 교수는 세계 최고의 AI 연구실을 만들려면 무엇을 어떻게 해야 하는지 알고 있었다. 

“최고의 인재를 원한다면 그들이 매력을 느낄 만한 최고의 연구실과 야심찬 장기 목표를 가져야합니다. 또한 그들에게 연구의 자율성을 부여하는 한편 지금까지 이뤄낸 연구성과들을 공유해야 합니다. 이는 ‘개방성(openness)’이라는 페이스북의 철학과도 일맥상통하는 것이죠.” 

 

 

인공지능 대가 영입


페이스북은 기계학습 및 딥 러닝 개발 엔지니어들은 사용자들이 관심 보일 컨텐츠, 스토리를 연결하여 정보를 제공하는 알고리즘을 개발하였다. 다른 사람들의 소식을 전달하고, 광고나 검색어 순위를 인공지능이 산출하고, 스팸이나 불쾌감을 일으킬 콘텐츠 차단에도 인공지능 알고리즘으로 처리한다.  
컴퓨터 비전 알고리즘은 시각 장애인을 위하여 사진이나 영상의 내용을 읽어 줄 수 있으며, 자동 번역 기능은 매일 20억개 이상 전 세계 사용자들의 삶에 대한 이야기를 다양한 언어로 번역되고 있다. 음성 인식 시스템은 뉴스 영상의 내용을 문자화하고 번역까지 실시간으로 처리하고 있다.   

컴퓨터 비전은 기계의 시각에 해당하는 부분을 연구하는 컴퓨터 과학의 최신 연구 분야 중 하나이다. 공학적인 관점에서, 컴퓨터 비전은 인간의 시각이 할 수 있는 몇 가지 일을 수행하는 자율적인 시스템을 만드는 것을 목표로 한다 

저커버그는 AI를 미래 핵심 사업전략으로 선정한 뒤 기계학습 전문가인 구글브레인팀의 마크 아우렐리오 란자토( Marc'Aurelio Ranzato) 박사를 영입했다.  또한  AI 연구에 몰두하고 있던 얀 레쿤 (Yann LeCun) 뉴욕대 교수를 영입하였습니다. 얀 르쿤 교수는 CNN알고리즘을 개발한 인물입니다.  CNN 알고리즘은 사진이나 영상에 대한 인식 및 판별에 뛰어난 성능을 보이는 인공지능 알고리즘이다. 뉴욕대학 컴퓨터공학과 교수인 얀 르쿤은 딥러닝(deep learning)으로 알려진 기계 학습 기술의 선구자 중 한 명이다. 이 방법은 거대 신경망의 사용에 달려 있다. 그는 문자와 숫자를 식별하거나 이미지에서 사람과 사물을 분류해 지정하는 것과 같은 컴퓨터 비전 작업에 이러한 딥러닝 기술을 적용하는 것으로 특히 유명하다.  



컨볼루션 네트워크(CNN, convolutional neural networks)

CNN 은 사람이나 동물의 시각 처리 과정을 모방하기 위해 개발된 신경망이다. CNN의 주요 개념 및 네트워크 구조는 1980년에 제안된 Neocognitron에서 시작되었다. 그 후, 1990년대 후반 크쿤은 경사도 기반 학습 알고리즘을 CNN 성공적으로 적용함으로써 다양한 영상 인식 분야에 널리 적용되었다.

기본적인 CNN은 세 종류의 계층으로 이루어진다. 
CNN의 중하위 계층은 convolution 계층과 max-pooling 계층으로 구성 된다. 이들은 특징을 추출하고 추상화하면서 점차로 높은 수준의 특징을 추출한다. CNN의 최상위 계층들은 fully-connected 계층으로 구성된다. 이들은 convolution 계층과 max-pooling 계층이 추출한 높은 수준의 특징으로부터 최종 결과를 계산한 다. Convolution 계층과 max-pooling 계층은 복수의 특징맵(feature map)으로 구성 된다. 각 특징맵은 다수의 노드들이 2차원적으로 배열된 구조를 갖는다. Convolution 계층의 특징맵은 복수의 입력 특징맵과 연결된다. 특징맵의 노드 들은 연결된 하위 계층 특징맵 중 특정한 위치의 윈도우 내의 노드들과 연결된 다. 이 때 동일한 특징맵의 노드들은 동일한 가중치를 공유하는데, 이는 2차원 영상 처리 및 특징 추출에 많이 사용되는 컨볼루션과 동일한 효과를 갖는다. 여 기에서 가중치는 컨볼루션 마스크의 역할을 수행하는데, 기존 컨볼루션 알고리 즘이 고정된 마스크를 이용한 반면 CNN에서는 컨볼루션 마스크가 신경망 가중 치로 구성되기 때문에 데이터로부터 자동으로 학습된다. 
Max-pooling 계층은 하위 계층에 위치한 convolution 계층과 동일한 수의 특징맵을 가지며 각 특징맵은 입력 특징맵과 1:1로 연결된다. Max-pooling 계층의 각 노드들 역 사 연결된 입력 특징맵 중 특정좌표에 위치한 윈도우내의 입력 노드들과 연결된다. Max-pooling 노드들은 자신과 연결된 입력 노드들의 값 중 최대값을 선택해서 자신의 값으로 가져온다. Max-pooling의 동작은 매우 단순하나, 영상 인식에 있어서 매우 중요 한 두 가지 역할을 담당한다. 첫째는 각 특징이 추출되는 위치상의 변이를 흡수하는 것이다. Max-pooling node들은 윈도우 내의 특징값 중 최대값을 취하지만, 그 좌표는 무시한다. 그 결과 특징의 위치가 윈도우 내에서 변할 경우 출력값에 아무 영향을 받 지 않기 때문에 특징값은 보존하되 작은 위치 변이는 흡수하는 역할을 한다. 또한 max-pooling 계층은 입력 특징맵을 그보다 작은 크기의 특징맵으로 매핑하는데, CNN 에 여러 개의 max-pooling 계층이 있다면 이들을 지나는 동안 특징맵의 크기가 빠르게 감소하여 적은 수의 계층으로도 큰 영상을 인식할 수 있게 한다. CNN의 최상단에는 fully-connected 계층이 위치하는데, 이들은 하위 계층에서 추출한 높은 수준의 특징으로부터 최종 인식 결과를 결정한다. Fully-connected 계층의 각 노드들은 하위 계층의 모든 노드들과 연결된다. CNN은 기존 오류 역전파 알고리즘과 동일한 원리의 경사도 기반 방법에 의 해 학습될 수 있다. CNN의 중하위 계층을 이루는 convolution 계층과 max-pooling 계층의 노드들은 매우 제한된 수의 입력 노드들과 연결된다. 따라 서, 계층간 연결이 많은 신경망에 비해 오차 신호가 섞어서 상쇄되는 문제가 훨 씬 적게 발생한다. 또한 CNN은 특징 추출에 매우 효과적인 convolution 계층과 위치 변이 흡수에 효과적인 max-pooling 계층을 통해 높은 수준의 특징을 추출 하기 때문에 다양한 변이에도 잘 적응한다. 그 결과, CNN은 다양한 영상 인식 분야에 적용되어 매우 높은 성능을 보이고 있다.

페이스북의 인공지능 반도체 칩 개발계획 

페이스북이 기존 디자인과 전혀 다른 방식으로 작동하는 새로운 종류의 인공지능 반도체 칩 개발계획을 발표하였다. 인공 지능을 다루기 위해 고안된 컴퓨터 하드웨어의 역사와 미래에 대한 연구 논문을 발표했다. 
얀 르쿤(Yann LeCun)은 인공 지능의 발전을 뒷받침하는 심층학습 알고리즘을 훈련하는 데 사용되는 칩이 여러 종류로 나눠있어 분산처리 하지 않고도 데이터를 조작 할 수 있어야 한다고 보았다. 기존 컴퓨터 칩은 기계학습 시스템이 학습해야 하는 데이터 양을 처리하기 위해 학습 단위로 나눠서 각각을 순서대로 처리하고 있다. 
얀 르쿤은 “뒤집지 않은 돌을 남겨두고 싶지 않다. 특히 아무도 돌을 뒤집지 않는다면 더욱 그렇다”라며 혁신 의지를 밝혔다.  

인공지능 칩은 인텔과 협력하고 있으며, 2020년 하반기에 출시될 것으로 예상된다. 
이 칩은 빠르게 성장하고 있는 인공지능 컴퓨팅 시장을 선점하기 위한인텔사의 전략과 맞물려 있다. 엔비디아와 아마존의 유사한 칩들과의 경쟁에 직면하게 될 것이다. 이 칩은 추론 기능에 초점을 둔 것으로 사진 속의 친구들에 대하여 자동적으로 태그를 달아 줄 수도 있다. 인텔의 인공지능 칩은 머신러닝 추론 시장을 지배하고 있으며 이 추론은 2021년에는 118억달러의 가치가 될 것으로 예상한다.   

페이스북이 인공지능과 방대한 데이터 센터의 복잡한 작업량 관리 등 다양한 애플리케이션을 위한 자체 칩을 개발하기 위해 하드웨어 팀을 설립하였다.   . 
지금까지는 GPU가 심층적 연구를 위해 중요하지만, 데이터 센터, 휴대전화,  가정용 디지털 보조장치에서 작동ㅁ는 AI 알고리즘에는 적합하지 않았다고 지적하면서 미래의 AI 칩 설계가 정보를 보다 효율적으로 처리해야 한다는 주장이다. 예를 들면 사람의 두뇌는 학습 할 때 시스템 대부분의 뉴런을 활성화 할 필요가 없다. 하지만, 현재의 칩은 사용하지 않더라도 모든 계산  단계에서 네트워크의 모든 단위가 정보를 처리해야 한다. 이로 인한 프로세스의 효율성을 개선하려는 것이다.