데이터과학 및 비즈니스 애널리틱스 연구실

“산업 현장에서 직면하는 다양한 문제에 대한 데이터 기반의 의사 결정을 지원하기 위한 데이터 과학의 요소 기술(AI, ML 등)을 개발합니다.
시계열, 자연어, 비전의 세 가지 데이터 타입별 소규모 연구 그룹을 운영하며,
주 관심 분야 이외의 연구원들과의 교류를 통해 다양한 형태의 데이터를 적재적소에 활용할 수 있는 역량을 함양합니다.
제조/IT/서비스 분야의 다양한 기업들과의 협업을 통해 도메인 지식을 습득합니다.”

연구실명
데이터과학 및 비즈니스 애널리틱스 연구실 Data Science & Business Analytics Lab
지도교수
Prof. 강필성 (Pilsung Kang)
연구실 구성원
재학생 (박사과정 6명 / 석박통합과정 1명 / 석사과정 4명)
주요 연구 분야
▪ 시계열 데이터: 시계열 표상 학습, 이상치 탐지 및 예측 방법론 개발 및 응용
▪ 자연어 데이터: 오피니언 마이닝, 로그 이상치 탐지, 언어모델의 효율적 학습
▪ 이미지 데이터: 이미지 이상치 탐지, Active Learning, 비전-언어 모델 등
대표 연구 또는 프로젝트
▪ 연구: Jaehee Kim, Yukyung Lee, Pilsung Kang*. (2024). A Gradient Accumulation Method for Dense Retriever under Memory Constraint. NeurIPS.
▪ 연구: Hyeongwon Kang, Pilsung Kang*. (2024). Transformer-based Multivariate Time Series Anomaly Detection using Inter-Variable Attention Mechanism. Knowledge-Based Systems, 290, 111507.
▪ 연구: Jaehyuk Heo+, Seungwan Seo+, Pilsung Kang*. (2023). Exploring the Differences in Adversarial Robustness Between ViT- and CNN-Based Models Using Novel Metrics. Computer Vision and Image Understanding. 235, 103800. (+: Equally contributed)
▪ 프로젝트: 자율 생산 시스템을 위한 생성, 예지, 처방형 보전 아키텍처, 한국연구재단 기초연구실 지원사업
▪ 프로젝트: 설명 가능한 멀티모달 이상치 탐지 방법론 개발 및 산업 데이터 응용, 한국연구재단 중견연구자 지원사업
▪ 프로젝트: 다종 데이터 학습을 위한 Muilti-Modal Learning 개발, LG이노텍
▪ 프로젝트: 금융도메인에서의 Large Language Model 평가 방법론 개발, 카카오뱅크
▪ 프로젝트: 제품 수율 최대화를 위한 Active Learning 기반의 불량 데이터 라벨링 프레임워크 구축, 삼성전자
관련 교과목
대학원 과목: 데이터 마이닝 기법 (406.546 001)
연락처
02-880-7360
위치
39동 411호
주요 진로
학계 및 산업계 Industrial Data Analytics 전문가
지원 문의
홈페이지 연구실 신입생 선발 절차 참고 (http://dsba.snu.ac.kr/apply)

데이터과학 및 비즈니스 애널리틱스 연구실(Data Science & Business Analytics Lab)은 데이터 기반의 의사결정(Data-driven Decision Making)을 위한 기계학습 및 인공지능 방법론을 개발하고 이를 실제 산업 현장에 적용하는 산업 데이터 애널리틱스(Industrial Data Analytics)를 중점적으로 연구하고 있다.

 

다양한 산업 현장에서 발생하는 여러 형태의 데이터를 다루기 위하여 연구실 내부적으로 시계열(Time-Series), 자연어(Natural Language), 시각(Vision) 데이터를 주 연구 분야로 하는 세 개의 연구 그룹으로 구성되어 있으며, 이들을 복합적으로 활용하는 멀티모달 인공지능(Multi-modal AI) 역시 주 연구 주제로 다루고 있다. 시계열 데이터를 활용한 주요 연구 분야로는 이상치 탐지 및 예측, 효과정인 표상 학습 등이 있으며 자연어 데이터를 활용한 주요 연구 분야로는 대화 시스템 평가, 로그 이상치 탐지, 효율적 정보 검색 등이다. 또한 시각 데이터를 활용한 주요 연구 분야로는 이미지 이상치 탐지, 효율적 학습을 위한 Active Learning, 적대적 공격 탐지 및 방어 등이 있다.

 

본 연구실에서는 한국연구재단(NRF) 기초연구실, 정보통신기획평가원(IITP) SW컴퓨팅산업원천기술개발 등 다수의 정부 연구과제 수행을 통하여 기계학습 및 인공지능 관련 원천 기술 개발을 연구하고 있으며, 삼성전자, LG전자, 현대자동차, 카카오뱅크 등 국내 유수의 제조업, IT산업, 금융업 기업들과의 산학협력을 통해 도메인 지식의 습득과 함께 개발한 방법론의 현장 적용 및 실증도 함께 수행하고 있다.