2019 International Conf. on Computer Vision - 서승완

ICCV
작성자
관리자
작성일
2020-03-12 13:55
조회
60
2019 ICCV (International Conference on Computer Vision) 학회가 서울에서 개최되었다. 2019년 10월 27일부터 11월 2일까지 일주일간 진행되었으며 많은 튜토리얼을 포함하고 있었다. 사실 올 초 연구실 세미나 발표를 준비하면서 올해 ICCV가 서울에서 열린다는 것을 처음 알게 되었고, 연구실 사람들과 공유하면서 계속 열리는 날을 기다려 왔다. 대학원생의 신분으로 있는 동안 한국에서 관심 있는 분야의 세계적인 학회가 열리는 기회를 얻을 수 있음에 매우 기뻤고 감사할 일이라 생각했다. 2019 INFORMS Annual Meeting을 다녀온 후 바로 27일 튜토리얼부터 참석하였으며, 이번 ICCV는 accept rate 20% 였으며 oral presentation을 진행하였거나 그렇지 못한 연구 모두 poster를 통하여 본인의 연구를 알릴 시간을 가졌다. INFORMS를 다녀온 직후라서 그런지 poster session을 대하는 두 학회의 입장 차이가 더욱 선명하게 느껴졌고, oral 발표는 하지 못하더라도 poster 라도 걸어보고 싶다는 생각이 간절했다(20%에 속할 수 있다면!). Poster session을 진행하는 동안에는 oral session을 진행하지 않아 대부분의 연구자들이 poster앞에 모여 질문하고 토론을 하였다. 역시 관심 있는 adversarial example과 GANs에 대한 포스터에서 이런 저런 질문을 하였지만 원하는 대답을 들은 적도, 그렇지 못한 적도 있었다.

 

 

 

[Sunday Tutorial – Interpretable Machine Learning for Computer Vision]

 

ML과 DL의 해석력은 언제나 많은 연구자들에게 고민을 안겨준다. 본 튜토리얼을 참석하고 가장 크게 느낀점은 모델을 뜯어서 해당 모델이 어떤식으로 주어진 문제를 해결하는지 보여주는 방식은 DL에서 매우 어려운 문제라는 것이다. 연구자들도 이러한 문제를 충분히 인정하고 이를 완화하기 위하여 여러 방면으로 연구를 진행하고 있다. 그 중 하나가 input의 변화에 따른 output의 변화인데 튜토리얼을 듣기 전까지만 하더라도 이런 부류의 연구는 ‘해석’이 아니라는 생각이 지배적이었는데 튜토리얼 참석 후에는 interpretable의 범위를 너무 한정지을 필요가 없다는 생각이 들었다.

 

튜토리얼은 전반적으로 시각화를 통해 모델이 집중하고 있는(CAM-based) 부분을 집중적으로 보여주었고, 가장 신기했던 talk은 Alexander Binder가 진행했던 강화학습 모델에 대한 해석이었다. 우리에게 익숙한 Atari breakout game에서 학습을 시작하는 단계에서 모델은 brick에 activation을 한다. 학습이 어느정도 진행되어 epoch 6에 다다르면 모델은 벽돌이 아닌 공과 bar에 activation을 하기 시작한다. 이를 통해 우리는 모델이 공을 놓치면 죽는 것(게임이 끝남)을 학습하고 있음을 알 수 있다. 학습이 계속 진행되어 epoch 50에 이르면 벽돌에는 activation이 완전히 사라지고 공과 bar에 이전보다 약한 activation이 그리고 ‘왼쪽 구석에 activation’이 생성된다. 흔히 아는 것처럼 breakout game을 진행하다 보면 모델이 왼쪽 구석 벽돌을 깨고 공을 벽돌 위로 넣으려는 행위를 시도하고 성공하게 된다. Activation이 되는 영역을 보여줌으로써 이러한 모델의 행동을 해석할 수 있었다.

 

또 하나 흥미로운 점은 “identify biases in train + test data”라는 제목으로 발표한 내용이었는데, 내용을 이러했다. 생각해보면 비행기는 하늘 한 가운데 떠 있다. ImageNet과 같은 open dataset을 보더라도 비행기 사진은 파란색 배경 가운데 비행기가 있는 형태가 대부분이다. 이러한 상황에서 비행기 사진의 하늘 색을 딴 띠(band)를 강아지와 같은 다른 class의 이미지의 main object 위 아래에 붙이면 해당 이미지의 비행기에 대한 confidence가 상당히 올라간다. 이를 통해 DL model들이 여전히 사물을 사람과 같이 인식하지 못함을 확인할 수 있었다.

 

논문을 읽으면서 많이 봤고 대단하다고 느꼈던 Bolei Zhou라는 분도 Understanding Latent Semantics in GANs 라는 주제로 talk을 진행하였다. Generator의 특정 unit을 적절하게 변경하거나 사용하지 않음으로써 원하는 객체를 생성/제거 할 수 있었다. 예를 들어 건물을 생성하는 generator에서 문을 담당하는 유닛을 켜고 끔으로써 건물에 문을 생성할 수도, 제거할 수도 있다. 사족이지만 개인적으로 Bolei 씨가 당연히 연구직에 있는 사람이라고 생각했다. 하지만 작년까지 나와 같은 박사과정이었고 생각보다 매우 충격이었다.

 

 

 

[Monday Tutorial – Visual Recognition for Images, Video, and 3D by FAIR]

 

월요일은 FAIR에서 튜토리얼을 진행하였다. Object detection의 대가인 Ross Girshick씨가 Object Detection and Instance Segmentation이라는 주제로 talk을 진행하였고 내용은 RCNN 시리즈의 설명이었다. 이후에 간략하게 좋은 논문을 작성하는 방법에 대하여 설명하였다. 세계적인 연구자의 논문 쓰는 법을 알게 되어 신기하였지만 새로운 내용은 없었다.  우리도 좋은 논문을 쓸 수 있지 않을까!?

 

그리고 FAIR에서는 연구자와 개발자를 같은 팀에 소속시키는 것 같았다. 그래서 양질의 연구와 API code가 함께 산출되어 사용자들의 접근성을 크게 향상시키고 있었다.

 

 

 

[학회 후기]

 

재밌고 흥미로운 연구가 가득한 학회였다. Oral presentation이 5분으로 매우 짧아 아쉬웠지만 vision conference답게 연구의 main idea나 contribution 그리고 결과를 시각적으로 볼 수 있어서 다행이었다. 모든 발표자들이 oral presentation을 마무리 하면서 본인의 포스터 번호를 알려주었고 궁금한 점이 있으면 찾아 와서 함께 이야기 하자는 플로우가 신선하였다.

 

시각적으로 보기에 매우 훌륭하고 발표 자료를 잘 만들었다고 생각이 든 발표는 “SinGAN”이었다. Best paper라 그런지 발표가 매우 훌륭하였고 발표만 봤을 때는 정말 대단한 논문이 나왔구나 라는 생각이 절로 들었다. 하지만 실제로 논문을 봤을 때는 기대가 너무 컸던 탓인지 기대보다는 획기적이지 못했다. 있는 framework들을 여기 저기서 잘 조합한 형태였으며 이러한 재조합으로 이렇게 좋은 성과를 보일 수 있음이 신기하였다. “Specifying Object Attributes and Relations in Interactive Scene Generation”이라는 연구도 매우 흥미로웠다. 이미지에 존재하는 object들을 파악하고 각 object들을 분리하여 사용자가 원하는 위치에 원하는 object를 주변과 잘 조화되게 생성할 수 있는 연구였다. 이러한 연구가 조금 더 고도화된다면 실상에서도 효용성이 매우 클 것이라 기대된다. 뿐만 아니라 “Seeing What a GAN Cannot Generate” 에서는 GANs이 일반적으로 생성하지 못하는 objects들에 대한 탐색이 있었고 결론적으로 사람이나 자동차와 같이 이미지 전반에서 작고 많이 형성되어 있는 객체들을 잘 생성하지 못함을 발견하였다. 이러한 한계를 완화할수 있는 GANs 구조를 만들어 낸다면 후속 연구를 위한 굉장히 좋은 선행 연구가 되지 않을까 생각이 들었다.

 

Deep learning poster session에서는 다양한 방식의 defense against adversarial examples 연구가 발표되었다. 그 중에서도 “Sparse and Imperceivable Adversarial Attack” 이라는 연구가 굉장히 흥미로웠다. 해당 연구에서는 이미지의 굉장히 작은 영역에서 sparse하게 pixel value를 변경하여도 model을 fool할 수 있음을 보였다. 보여주는 예시 중에 가장 흥미로운 점은 이미지의 배경부분에 sparse하게 perturbation을 주더라도 모델을 속일 수 있다는 점이었다. 연구를 진행하면서 이러한 결과들이 왜 일어나는 것 같은지 고민해 봤냐고 물어봤더니, 대답하기로 나도 모르겠다 라고 했다. 연구를 하는 사람들에게도 정말 모를 일이구나 라는 생각이 들었다. 뿐만 아니라 스케쥴을 확인하고 관심있는 분야의 대부분의 포스터를 봤는데, 생각보다 더 즐거웠던 포스터도 있었고 기대에 미치지 못하는 포스터도 있었다. 역시 논문은 제목을 잘 정해야 한다는 생각이 다시 들었다.

 

 

참 오래 기대하고 그만큼 기대한 학회가 끝이 났다. 긴 여운과 동기부여가 되지 않을까 생각한다. 학회는 끝이 났지만 “Rethinking ImageNet Pre-training”, “InGAN”, “Adversarial Feedback Loop”와 같이 읽고 싶은 논문이 너무 많아 한동안 논문을 열심히 읽으면서 시간을 보낼 것 같다.

 

이런 좋은 기회를 지원해주신 교수님께 감사드린다.

 
전체 0

전체 181
번호 제목 작성자 작성일 추천 조회
12
2019 International Conf. on Computer Vision - 천우진
관리자 | 2020.03.12 | 추천 0 | 조회 107
관리자 2020.03.12 0 107
11
2019 International Conf. on Computer Vision - 이정호
관리자 | 2020.03.12 | 추천 0 | 조회 59
관리자 2020.03.12 0 59
10
2019 International Conf. on Computer Vision - 정민성
관리자 | 2020.03.12 | 추천 0 | 조회 55
관리자 2020.03.12 0 55
9
2019 International Conf. on Computer Vision - 최종현
관리자 | 2020.03.12 | 추천 0 | 조회 109
관리자 2020.03.12 0 109
8
2019 International Conf. on Computer Vision - 서승완
관리자 | 2020.03.12 | 추천 0 | 조회 60
관리자 2020.03.12 0 60
7
2019 International Conf. on Computer Vision - 최희정
관리자 | 2020.03.12 | 추천 0 | 조회 105
관리자 2020.03.12 0 105
6
2019 International Conf. on Computer Vision - 양우식
관리자 | 2020.03.12 | 추천 0 | 조회 111
관리자 2020.03.12 0 111
5
2019 International Conf. on Computer Vision - 이정훈
관리자 | 2020.03.12 | 추천 0 | 조회 449
관리자 2020.03.12 0 449
4
2019 International Conf. on Computer Vision - 박중민
관리자 | 2020.03.12 | 추천 0 | 조회 87
관리자 2020.03.12 0 87
3
2019 International Conf. on Computer Vision - 김형석
관리자 | 2020.03.12 | 추천 0 | 조회 111
관리자 2020.03.12 0 111

Data Science & Business Analytics Lab.
School of Industrial Management Engineering
College of Engineering, Korea University

Contact Us

  • 강필성 교수 (pilsung_kang@korea.ac.kr)
    서울특별시 성북구 안암로 145 고려대학교 자연계캠퍼스 창의관 801A호 
  • 대학원 연구실 (총무 이유경: yukyung_lee@korea.ac.kr)
    서울특별시 성북구 안암로 145 고려대학교 자연계캠퍼스 신공학관 220호, 221호, 213호
© 2020 DSBA Lab.