본문 바로가기
IT, 정보통신/AI_머신런닝

튜링 GPU는 어떻게 몰입형 AI를 혁신하는가

by newly everyday 2018. 10. 24.



튜링 GPU는 어떻게 몰입형 AI를 혁신하는가



James Kobielu | InfoWorld

이제 GPU(Graphic Processing Unit)는 단순한 그래픽 칩에 그치지 않는다. 인공지능 혁명의 핵심으로 자리매김했다. 고충실도 3D 이미지 처리를 위한 연산 성능 덕분에 정교한 AI 애플리케이션을 작동시키는 신경망을 뒷받침하는 엔진으로 이어졌기 때문이다.

그렇다고 GPU가 처음부터 AI를 위해 개발된 것은 아니다. 엔비디아, AMD, 기타 칩 제조사들은 수 년 동안 PC그래픽, 상호형 게임, 이미지 후처리, 가상 데스크톱 인프라를 위한 GPU를 제공하면서 많은 수익을 얻었다.

그럼에도 불구하고 그래픽 처리와 AI 사이의 관련성은 부정할 수 없다. CNN(Convolutional Neural Network) 같은 경우 AI의 최전방에 서 있으며 주로 이미지 분석, 분류, 렌더링, 조작에 활용된다. GPU는 많은 애플리케이션에서 CNN 처리를 위한 주된 하드웨어 장치라고 할 수 있다.

Image Credit : Getty Images Bank


AI와 이미지 처리의 공통점
기술적인 관점에서 이미지 처리와 AI의 공통점은 병렬적인 행렬벡터 연산에 의존한다는 것이며 여기에서 GPU가 빛을 발한다. 기본적으로 AI 기술의 매트릭스(일명 ‘텐서’(Tensor) 그래프)는 컴퓨터 생성 이미지 프레임의 픽셀 매트릭스 또는 점들의 열과 행과 같다.

GPU에 내장된 메모리 구조는 그래픽 이미지 전체를 하나의 행렬로 처리하며, 이는 딥러닝과 기타 AI행렬의 동시 실행을 통해 얻은 적응형 지능을 통해 농축된다. 이 아키텍처를 통해 GPU구동 시스템은 인라인AI를 활용하여 이미지 업데이트 및 수정 처리를 동적으로 그리고 선택적으로 가속화한다.

또한 애플리케이션 수준에서는 이런 작업 부하들 사이의 공생 관계가 명확하며, 이것이 GPU가 여러 그래픽이 풍부한 지능형 애플리케이션에서 선호되는 하드웨어 가속기 기술인 경우가 많은 이유이다.

AI가 점차 이미지를 자동으로 안정화하고 색상 및 노출을 조정하며 초점을 선택하고 현장에서 촬영하는 장면에 따라 실시간으로 이미지를 조정하여 기술이 서투른 사진을 촬영할 가능성을 줄여주는 스마트 카메라 등의 대중 시장 이미지 처리 제품에 내장되고 있다.

마찬가지로 노이즈 제거, 해상도 확장, VRS(Variable Rate Shading), 객체 감지, 가장자리 감지, 동작 감지, 누락된 엘리먼트 보간 등의 정교한 이미지 처리 기능이 스마트 카메라에 적용되면서 GPU 구동 AI 도입이 증가하고 있다.

실제로 브라우저 기반 머신러닝(ML) 도입 증가는 대부분 이미지 감지, 인식, 분류, 조작 등 GPU로 강화된 그래픽 집약적인 애플리케이션에 집중되어 있다. 그리고 GPU는 그래픽 애플리케이션에 게임, 예술, 엔터테인먼트, 의료, 기타 애플리케이션을 위한 사진과 동일한 고화질 이미지를 생성하는 것이 포함된 첨단 AI 접근방식인 GAN(Generative Adversarial Network)을 뒷받침하고 있다.

심지어 새로운 세대의 GPU 구동 스마트폰은 사람의 얼굴 이미지에 실제처럼 보이는 개선(실제로는 보정)을 적용하기 위해 개발된 동적 이미지 조작을 적용한다.

대부분의 배치에서 GPU와 CPU는 공생 관계가 있지만 GPU가 빛나는 영역은 명확하다. CPU코어와 비교하여 스트림 멀티프로세서(Stream Multiprocessor)라는 GPU의 실행 장치는 병렬로 더 많은 연산을 수행할 수 있다. GPU는 고속 벡터화와 행렬 조작을 위해 로컬 메모리와 레지스터에 더 많은 재사용 가능한 캐시 데이터를 저장할 수 있다. 또한 GPU는 CPU보다 메모리 대역폭이 더 높고 쓰레드 병렬화가 더 크며 짧은 경로 레지스터 메모리에 더 많은 데이터를 보관할 수 있다.

어떻게 엔비디아의 튜링 아키텍처를 통해 AI를 이용한 몰입형 경험이 가능한가?
엔비디아는 최근 튜링 아키텍처를 발표하면서 3D 이미지 처리와 인공 신경망을 통합하는 애플리케이션에서 가지는 GPU의 장기적인 이점을 강조했다. 튜링은 엔비디아의 8세대 GPU 아키텍처로 엔비디아 쿼드로(Quadro) RTX 8000, 쿼드로 RTX 6000, 쿼드로 RTX 5000 등 여러 신형 GPU에 통합됐다.

엔비디아의 종전 GPU 버전에 필수적이었던 그래픽 최적화 쿠다(CUDA) 코어와 AI 강화 텐서 코어의 개선 외에 엔비디아는 실시간 시나리오에서 엔비디아의 GPU가 광선 추적 연산을 더욱 빠르고 효율적으로 수행할 수 있도록 개발된 RT 코어라는 튜링에 새로운 그래픽 최적화 기술을 통합했다.

튜링은 고성능 컴퓨터 생성 이미지 애플리케이션에서만 사용할 수 있었던 광선 추적이 광선 전달의 물리학을 모델화한다. 엔비디아가 주로 "사실같은 게임"을 위한 튜링의 실시간 광선 추적을 홍보하고 있지만(그리고 이것이 마이크로소프트가 이 기술에 투자하는 이유를 이해하는데 도움이 되지만) 이 기능은 분명 몰입형 경험을 제공하기 위해 현실적인 시각 처리에 의존하는 실사화 애플리케이션에 적합하다.

그 기능은 광선이 주변 환경 안에서 물체에 의해 반사, 회절, 분산, 차단되는 방식을 모델화하는 것이다. 동적 광선 추적 장면은 전통적인 래스터(Raster)화 컴퓨터 시각화보다 훨씬 현실적으로 보일 수 있다. 실시간 광선 추적은 변화하는 반짝거림, 그림자, 색 변화 패턴과 기타 광선 확산 효과를 높은 충실도로 시뮬레이션할 수 있다.

연산 집약적인 실시간 광선 추적은 사용자가 원활한 가상 세계와 물리 세계의 융합을 기대하는 게임, 협업, 기타 몰입형 애플리케이션에서 차이를 보일 수 있다. 그 결과 엔비디아의 튜링 GPU는 사용자를 완전한 인공 디지털 환경에 몰입시키거나 실사 환경 위에 가상의 객체를 덧씌우거나 가상의 객체를 현실에 고정시키고 사용자가 가상의 객체와 상호작용할 수 있도록 하는 AI 강화 그래픽 애플리케이션에 초점을 맞추고 있다.

즉, GPU는 엔비디아의 튜링 아키텍처를 통해 알 수 있듯이 가상, 증강, 혼합현실 장치와 애플리케이션의 필수 구성 요소이다. 그래서 엔비디아가 튜링을 출시할 때 하나의 고대역폭 USB-C 케이블을 중심으로 가상 현실 연결을 표준화하는 새로운 USB-C 대안 모드인 버추얼링크에 대한 기본 지원을 포함시켰을 때에도 당연하게 느껴졌다. 그리고 인텔이 2년 후에 자체 GPU를 출시할 계획인 것도 당연해 보인다.



하지만 이미 꽤 늦었고 순수하게 게임만을 대상으로 하기에는 목표를 잘못 설정한 것으로 보이며 게임 및 콘텐츠 생성의 그래픽 작업 부하에 최적화된 새롭게 발표된 차세대 그래픽 멀티코어 CPU에 대한 관심을 반감시키는 것으로 보인다.

이와 상관없이 엔비디아는 튜링 칩을 통해 GPU 시장 주도권을 확장할 가능성이 높아 보인다. 새로운 세대의 GPU는 AI를 전 세계의 모바일, 임베디드, 엣지, IoT 애플리케이션에 통합시키는 첨단 몰입형 애플리케이션에 적합하다.

몰입형 기술이 적용될 것으로 예상되는 곳
그래픽이 풍부한 AI 애플리케이션에 튜링 GPU가 적용될 것임을 쉽게 예상할 수 있다.

- 협업 : AI 생성 그래픽 아바타는 모든 사람이 헤드셋과 노이즈 캔슬링(Noise Canceling) 헤드폰에 접근하고 협업 몰입형 가상 환경에 진입할 수 있는 가상 및 물리적 협업의 몰입형 융합을 지원할 수도 있다.

- 학습 : AI 생성 시뮬레이션은 개인 및 집단을 위한 상호적이고 현실적인 3D 경험 학습 환경을 제공할 수 있다.

- 마케팅 : AI 생성 제품 카탈로그를 통해 현실적으로 렌더링된 3D 아이템을 고객의 신체 또는 집, 자동차, 기타 환경에 덧씌우기, 배치, 사용자 정의, 장착할 수 있다.

- 디자인 : 개발자와 엔지니어는 AI 생성 프로토타입을 사용해 물리적인 프로토타입을 제작하거나 현장으로 보내기 전에 가능한 미래의 결과물에 대하여 완벽하게 렌더링된 3D 디자인과 상호작용할 수 있다.

- 내비게이션 : AI 생성 그래픽 자동 완성 또는 "인페인팅(Inpainting)"을 HUD(Head-up Display)에 이행하면 운전자가 차량의 사각 지대를 확인하거나 간과하기 쉬운 실시간 주변환경의 중요한 물체를 찾는데 도움이 될 수 있다.

- 의약품 : AI 생성 그래픽 해상도 개선은 의사가 스마트 고글(Smart Goggle)을 사용하여 외과수술 수행 중 인체 조직의 세부사항을 바로 확인하는데 도움이 될 수 있으며 진단, 교육, 기타 의료 시나리오를 지원하기 위해 의료용 마네킹을 실제 환자 위에 가상으로 덧씌울 수 있다.

- 산업 : AI 증강 디지털 트윈 환경은 융합된 물리 및 가상 환경에서 제조, 물류, 기타 산업 부동산의 그래픽 모델링, 최적화, 유지보수를 지원할 수 있다.

GPU의 약점
하지만 GPU는 만능 하드웨어 가속기가 아니라는 사실을 염두에 두어야 한다. GPU는 일반적으로 CPU보다 메모리 용량이 작고 GPU는 CPU가 있어야 데이터를 소화한다. 또 GPU 클럭(Clock) 속도는 기껏해야 고성능 CPU의 1/3 수준 밖에 되지 않기 때문에 GPU가 순차 작업을 신속하게 처리하는 능력이 제한된다.

마찬가지로 GPU가 반드시 정보를 그래픽 적용 모바일, 엣지, IoT, 기타 애플리케이션에 적용하는 모든 AI 작업 부하를 위한 최적의 하드웨어 가속기 기술은 아니다. 더욱 현대적인 제품의 핵심에 있는 SoC(System on a Chip)에서 GPU는 CPU 및 TPU(Tensor Processing Unit), FPGA(Field Programming Gate Array), ASIC(Application-Specific Integrated Circuit) 등의 다른 특화된 신경망 프로세서와 함께 자리를 차지하고 있다.

발전하는 지능형 종단 장치 생태계에서 진정한 공존은 이 모든 임베디드 AI 칩들이 협력하여 실물 같은 현실성으로 우리를 놀라게 하는 시각 경험을 얼마나 잘 구현하느냐에 달려 있다. ciokr@idg.co.kr 



출처 : CIO코리아
원문보기:
http://www.ciokorea.com/news/39943?page=0,1#csidxc55bbd26cf73ee6bf0541a589d00e10

댓글