[기계신문] 인공지능 기반의 추천시스템 알고리즘 기술은 방대한 양의 컨텐츠를 사용자에게 개별 맞춤형 추천을 수행하고자 하는 목적을 가지고 있다.

이를 위해 인공지능 기반 추천시스템 알고리즘은 각각의 사용자 및 추천 객체를 임베딩(Embedding)이라 불리는 추상화된 데이터 형태로 학습하여 저장하며, 학습한 임베딩을 기반으로 개인 맞춤형 추천을 수행한다.

추천 객체 및 사용자 수에 따라 학습 및 저장해야 할 정보가 증가하는 특성에 의해 추천 인공지능의 경우 기존의 음성 및 이미지 처리를 위한 인공지능과는 그 크기 및 연산 특성이 매우 다르다.

이러한 특징은 서비스의 규모가 커질수록 두드러지며, 대규모 웹서비스의 경우 추천 인공지능 알고리즘 수행을 위한 메모리 용량 및 대역폭 요구량이 크게 증가하여, 기존 인공지능 가속기 시스템에서 큰 병목현상을 야기한다.

그런데 최근 국내 연구진이 세계 최초로 ‘프로세싱-인-메모리(Processing-In-Memory, PIM)’ 기술을 기반으로 한 인공지능 추천시스템 학습 알고리즘 가속에 최적화된 지능형 반도체 시스템 개발에 성공했다.

▲ KAIST 전기및전자공학부 유민수 교수 연구팀이 PIM 기술 기반의 메모리-중심 인공지능 가속기 반도체 시스템을 개발했다. (왼쪽부터) 유민수 교수, 권영은 박사과정, 이윤재 석사과정

KAIST 전기및전자공학부 유민수 교수 연구팀이 PIM 기술 기반의 메모리-중심 인공지능 가속기 반도체 시스템을 개발했다. 유 교수는 관련 분야에서 그동안의 연구 성과를 인정받아 올해 아시아에서 유일하게 ‘페이스북 패컬티 리서치 어워드(Facebook Faculty Research Award)’를 수상했다.

인공지능 기술을 기반으로 고안된 추천시스템 알고리즘은 구글(Google), 페이스북(Facebook), 유튜브(YouTube), 아마존(Amazon) 등 빅테크 기업들이 콘텐츠 추천 및 개인 맞춤형 광고를 제작하는 데 기반이 되는 핵심 인공지능(AI) 기술이다.

온라인 광고를 통한 수입은 구글과 페이스북과 같은 실리콘밸리의 빅테크 기업의 주 수익 모델인 만큼 고도화된 추천 인공지능 기술에 대한 수요는 최근 들어 급상승하는 추세다.

페이스북이 최근 공개한 자료에 따르면, 페이스북 데이터센터에서 처리되는 인공지능 연산의 70%가 추천 알고리즘을 처리하는 데 사용되며, 인공지능 알고리즘 학습을 위한 컴퓨팅 자원의 50%를 추천 알고리즘을 학습하는 데 사용하고 있다.

유민수 교수 연구팀은 최근 메모리 반도체에 인공지능 연산 기능이 추가된 프로세싱-인-메모리(PIM) 기술 기반의 지능형 반도체 시스템을 개발하는 데 성공했다.

연구팀이 개발한 이 시스템은 인공지능 추천시스템 알고리즘의 학습 과정을 엔비디아(NVIDIA)의 그래픽카드(GPU)를 사용하는 기존 인공지능 가속 시스템 대비 최대 21배까지 빠르다.

▲ 기존 딥러닝 학습 가속기 시스템에 지능형 메모리 반도체(PIM) 기술을 적용한 가속기 시스템의 모식도. 기존 심층신경망네트워크(DNN) 부분과 임베딩(Embedding)부분을 분리하여 각각 그래픽카드(GPU)와 메모리 중심의 지능형 메모리 반도체 (PIM core)를 이용하여 가속하는 시스템으로 구성되어 있다.

지능형 메모리 반도체 기술은 우리나라의 AI 반도체 세계시장 공략을 위한 핵심기술로 주목받고 있다. 특히 정부에서도 ‘AI 종합 반도체 강국 실현’이라는 비전 아래 막대한 국가적 투자를 아끼지 않는 핵심 투자 분야다.

따라서 이번 연구 성과는 향후 막대한 수요와 급성장이 예상되는 세계 AI 반도체 시장에서 메모리-중심으로 설계된 PIM 기술의 상용화 및 성공 가능성을 시사한다는 점에서 의미가 크다.

유민수 교수는 “추천 인공지능의 정확성이 기업의 이윤과 직결되는 상황인 만큼 점차 고도화되는 추천 인공지능 가속을 위한 컴퓨팅 시스템의 수요 및 시장성은 더욱 증가할 것으로 예상된다”며 “이번 연구 성과는 국내 지능형 메모리 반도체 기술 역량 강화 및 기술 상용화 가능성에 크게 기여할 것으로 기대된다”고 밝혔다.

한편, 유민수 교수는 서강대와 KAIST에서 각각 학사와 석사를 거쳐 미국 텍사스 오스틴 주립대에서 박사학위를 취득한 후 2014년 인공지능 컴퓨팅 기술 기업인 미국 엔비디아(NVIDIA) 본사에 입사했다. 엔비디아에 입사한 이후 줄곧 인공지능 컴퓨팅 가속을 위한 다양한 하드웨어 및 소프트웨어 시스템 연구를 주도했으며, 2018년부터 KAIST 전기및전자공학부 교수로 재직 중이다.

KAIST 전기및전자공학부 권영은 박사과정이 제1저자, 이윤재 석사과정이 제2저자로 참여한 이번 연구 결과는 세계 최초의 추천시스템 학습용 가속기 시스템 개발 성과라는 학술적 가치를 인정받아 컴퓨터 시스템 구조 분야 국제학술대회인 IEEE International Symposium on High-Performance Computer Architecture(HPCA)에서 ‘Tensor Casting: Co-Designing Algorithm-Architecture for Personalized Recommendation Training’이라는 논문 제목으로 내년 2월 발표될 예정이다.

기계신문, 기계산업 뉴스채널