인공지능 기반의 데이터 저장시스템 연구

From Course@DGIST
Jump to navigation Jump to search
인공지능 기반의 데이터 저장시스템 연구
제안자
자문교원 이성진
연도 2019
타입 A형 과제
코스 장영실
매칭여부
참여학생수
소개동영상 http://commons.dgist.ac.kr/em/5bf663f389fc6

제안 배경

과제 목표

최근 데이터센터 내에 저장된 대용량의 데이터를 딥러닝 등 기계학습 알고리즘을 이용해 분석하고자하는 요구가 크게 증가하고 있다. 이러한 요구를 만족시키기 위해서는 (1) 대용량의 데이터에 대한 신속한 접근과 (2) 기계학습 알고리즘의 빠른 수행이 필수적이며, 이를 가능하게 하기 위한 방법론으로 Near-data Processing (NDP) 혹은 In-storage Processing(ISP) 연구가 주목 받고 있다. 본 과제에서는 대용량의 빅데이터를 대상으로, 스토리지 시스템 내부에서 TPU (Tensor Processing Unit) 혹은 FPGA와 같은 가속기를 활용하여 기계학습 알고리즘을 가속시키는 NDP/ISP 시스템 개발을 목표로 한다.

과제 내용

가. 고성능 스토리지 플랫폼 개발

1) 낸드 플래시 메모리 기반의 고성능 스토리지 플랫폼 환경을 개발한다. 이를 위한 기반 환경으로 ARM 기반 임베디드 리눅스 시스템이 활용될 예정이며, 
   따라서 본 연구를 통해 학생들은 리눅스 운영체제, 디바이스 드라이버, 임베디드 시스템 펌웨어 등에 대한 기술에 대해 익히게 된다.

나. 머신러닝 기반의 가속기를 기 개발된 스토리지 플랫폼에 이식

1) 상기 개발된 플랫폼을 FPGA 혹은 TPU 가속기를 지원할 수 있도록 개선한다. 구축된 가속기 환경을 이용하여 Alexnet, Googlenet 등 다양한 머신러닝 알고리즘을 
   수행해보고 그 이점을 평가한다.

다. 다양한 응용에 대한 사례 연구 수행

1) 다양한 데이터 분석 응용을 대상으로 사례 연구를 수행한다. 이러한 응용의 예로는 이미지 검색 및 Tagging 시스템, 키워드 랭킹 시스템 등이 포함될 수 있다. 
   아울러 Caffe 및 TensorFlow 등 기존의 분석 기술 등과의 성능 비교 평가를 수행한다.

참고자료

희망학생