2019 International Conf. on Computer Vision - 박중민

ICCV
작성자
관리자
작성일
2020-03-12 13:53
조회
87

10월 27일(일) ~ 11월 2일(토) 기간 동안 열렸던 “ICCV 2019 Seoul, Korea” 라는 권위 있는 학회가 한국에서 열렸습니다. 세계의 뛰어난 연구자들의 연구 방향과 최신 트렌드를 알 수 있었고, 연구자들 모두 본업에 몰두하여 훌륭한 성과를 달성하는 것을 보고 많은 자극을 받았습니다. 좋은 기회를 제공하기 위해 지원을 해 주신 교수님께 감사드리며 부지런히 연구에 매진 하겠습니다.

[Everything You Need to Know to Reproduce SOTA Deep Learning Models]

기대했던 것보다는 많은 것을 얻지 못한 발표였습니다. Amazon에서 만든 MXNet과 GlounCV 라이브러리에 대해 소개하고 약 170 개의 SOTA pre-trained models 들이 다른 라이브러리 것들보다 성능이 좋다는 것이었습니다. 다만 해당 SOTA 모델을 튜닝할 때, 많은 Trick들을 배울 수 있었습니다. 먼저 Training 할 때, 저는 일반적으로 일정 Step별로 Learning rate를 조절하여 세부적으로 Loss를 조절하였지만, 여기서는 Warm-Learning rate로 초반에 explode 및 overfitting을 방지하는 전략으로 학습하였습니다. 또한, 성능 및 속도를 향상하기 위해 Weight에만 Decay를 적용하고 Bias와 Batch Normalization에는 적용하지 않았습니다. Label도 One-hot로 설정하지 않고, Smoothing 기법을 이용한 것이 인상적이었습니다.

[Scene Graph Representation and Learning]

CS224 를 통해 영상으로 보았던 사람들을 실제로 보니, 마치 연예인을 보는 느낌이었습니다. 발표의 큰 주제는 Text to Image와 같은 Task의 복잡한 Semantic relationship을 파악하기 위해 기존의 Pixel 기존의 I L-1 I loss 등과 같은 방법들은 파악하기 힘들고 Scene graph를 통한 Text의 Token들의 관계를 통해 기존의 Implicitly composition을 explicitly composition으로 잘 표현할 수 있고, 성능 또한 우수하다는 것입니다. 또한 Image와 Text는 구조적으로 다른 모델을 결합하는 경향이 있는데, Bert 같은 통일된 모델을 사용하고 Co-attention 및 Scene graph를 통해 모양이 비슷해도 의미가 다를 수 있는 관계들을 잘 파악할 수 있었습니다. Scene graph를 이용하기 위한 “Genome dataset”을 Stanford에서 곧 공개한다고 하였는데, 관련 연구를 하기 위해 해당 dataset을 이용해도 좋을 것이라 생각하였습니다.

[Image and Video Synthesis: How, Why and What if?]

“GAN Dissection ICLR 2019”의 논문 저자가 발표하였는데, 랜덤 벡터로부터 많은 이미지를 생성할 때 특정 Hidden state의 node에서 Object에 큰 영향을 끼치는 것들이 있다는 것을 발견하였다는 것입니다. 강연 중 첫 연구의 시작은 이미지 데이터에서 Deactivating banner neuron 들을 찾기 위해 탐색을 하였고, 이후 각 Node는 Object에 영향을 끼친다는 것을 발견하였습니다. Segmentation이 된 data를 사용하였지만 실험에 많은 노력을 했다는 것을 간접적으로 느낄 수 있었습니다. 해당 연구로 인해 Object detection이나 OCR Task에 잘 활용할 것으로 기대됩니다.

다른 연구로는 일반적으로 생성모델에서 일반적으로 Latent space에서 선형의 관계로 해당 feature를 표현할 수 있는 것을 Natural data space에서는 비선형의 특정 영역으로 나타날 수 있습니다. 이에 Latent space에 원하는 방향벡터와 그에 해당하는 가중치 Alpha를 통하여 생성 모델의 이미지를 확대/축소, 특정 영역의 변화 등의 다양하게 응용이 가능하였습니다. 현재 관심있는 분야도 Manifold 영역을 통해 원하는 것을 disentanglement 할 수 있는 것에 초점을 맞추고 있는데, 많은 도움이 되었습니다.

[Visual Learning with Limited Labeled Data]

개인적으로 가장 관심이 있는 분야였습니다. 현실적으로 라벨이 적은 데이터들이 많고, 이를 확보하기 위해 비용 등의 문제가 발생하기 때문에 많은 분야에 적용할 수 있을 것이라 생각했습니다. 제한된 데이터로 학습 시 overfitting으로 향하는 경우가 많고, 이를 보완하기 위해 Unsupervised learning, Transfer learning, Data augmentation을 많이 이용합니다. 이와 다르게 Few-shot learning은 보조 데이터를 활용해 representation을 활용하고, unseen 데이터를 활용하여 해당 규칙을 적용하는 것이고, 해당 연구 분야와 관련하여 Domain adaptation & generalization, Meta learning, Few shot learning 등이 발전할 여지도 많기 때문에 더 관심있게 들었습니다. 일반적으로 pre-trained model을 활용하기 위해 단순한 2가지의 전략이 있는데, 먼저 해당 Feature로 knn 이용, 두번째 방법은 higher layer의 weight만 fine-tune 하는 방법입니다. 더 나아가서 Episodic training 기법을 이용해 Training과 testing 환경을 동일하게 하고 overfitting을 막는 방법으로, Siamese network, matching network, prototypical network, relation network, TADAM, MAML 등 다양한 모델들이 있습니다. 현재 개인적으로 진행하고 있는 연구는 Manifold 상에서 해당 Feature들이 비슷해야 Few-shot learning도 잘 되기 때문에 그 부분에 초점을 맞춰서 실험을 진행하고 있습니다.

전체 0

전체 181
번호 제목 작성자 작성일 추천 조회
12
2019 International Conf. on Computer Vision - 천우진
관리자 | 2020.03.12 | 추천 0 | 조회 107
관리자 2020.03.12 0 107
11
2019 International Conf. on Computer Vision - 이정호
관리자 | 2020.03.12 | 추천 0 | 조회 59
관리자 2020.03.12 0 59
10
2019 International Conf. on Computer Vision - 정민성
관리자 | 2020.03.12 | 추천 0 | 조회 55
관리자 2020.03.12 0 55
9
2019 International Conf. on Computer Vision - 최종현
관리자 | 2020.03.12 | 추천 0 | 조회 109
관리자 2020.03.12 0 109
8
2019 International Conf. on Computer Vision - 서승완
관리자 | 2020.03.12 | 추천 0 | 조회 59
관리자 2020.03.12 0 59
7
2019 International Conf. on Computer Vision - 최희정
관리자 | 2020.03.12 | 추천 0 | 조회 105
관리자 2020.03.12 0 105
6
2019 International Conf. on Computer Vision - 양우식
관리자 | 2020.03.12 | 추천 0 | 조회 111
관리자 2020.03.12 0 111
5
2019 International Conf. on Computer Vision - 이정훈
관리자 | 2020.03.12 | 추천 0 | 조회 449
관리자 2020.03.12 0 449
4
2019 International Conf. on Computer Vision - 박중민
관리자 | 2020.03.12 | 추천 0 | 조회 87
관리자 2020.03.12 0 87
3
2019 International Conf. on Computer Vision - 김형석
관리자 | 2020.03.12 | 추천 0 | 조회 111
관리자 2020.03.12 0 111

Data Science & Business Analytics Lab.
School of Industrial Management Engineering
College of Engineering, Korea University

Contact Us

  • 강필성 교수 (pilsung_kang@korea.ac.kr)
    서울특별시 성북구 안암로 145 고려대학교 자연계캠퍼스 창의관 801A호 
  • 대학원 연구실 (총무 이유경: yukyung_lee@korea.ac.kr)
    서울특별시 성북구 안암로 145 고려대학교 자연계캠퍼스 신공학관 220호, 221호, 213호
© 2020 DSBA Lab.