2019 International Conf. on Computer Vision - 정민성

ICCV
작성자
관리자
작성일
2020-03-12 13:56
조회
56
10/27~11/2 동안 ICCV가 서울의 coex에서 개최되었습니다. 학생신분으로 해외에서 열리며 참가비가 비싼 국제적 conference에 참석하는 것은 요원한 일이기 때문에 이런 기회는 흔치 않은 것이었습니다. 이번 ICCV는 페이퍼의 acceptance rate이 20%이었다고 하니 얼마나 쟁쟁한 연구자들이 발표자로 참석하는지 알 수 있었습니다. 많은 이들이 열정적으로 연구한 결과를 발표하고 의견을 주고 받는 모습을 보며 많은 동기부여를 얻게 되었습니다. conference 구성은 Multi modal 이나 자연어처리와 연결한 연구발표도 있었지만 주요한 발표는 영상이나 이미지 처리가 중점적이었습니다. 컨퍼런스 내 발표는 구두발표와 포스터 발표로 이루어져 있었습니다. 생소한 점이 있다면 구두와 포스터 발표가 분리된 것이 아니라, 구두발표자가 포스터도 개제 하여 포스터 세션 때 자유롭게 다른 이들과 토론할 수 있다는 것이었습니다. 좋은 아이디어였고 많은 이의 호응을 얻을 수 있는 구성이었지만, 포스터 세션 때 사람들이 너무 몰려 포스터를 보는 것 조차 힘들었고 구두발표는 제한 시간이 5분이었다는 점은 아쉽고 불편한 점이었습니다. 하지만 수 천명의 참가자를 모두 만족시키는 것은 불가능하기 때문에 어쩔 수 없는 차선의 구성이었다는 생각도 하게 되었습니다.

 

10/27~28

후에 들어보니 다들 Tutorial에 참석해 있었고 굉장히 유익한 시간이었다고들 얘기했습니다. 저는 Tutorial에 대해 착각하여 이를 참석하지 않고 Workshops에 참석하였습니다. workshops에서는 작은 홀에서 발표자가 구두발표를 했습니다. 좋은 발표도 많았지만 짧은 영어로 인해 내용의 절반 정도는 휘발되는 경우가 많았습니다. 메인 컨퍼런스와 다르게 발표시간이 길고 질의응답 시간이 길어 정보습득에는 용이했습니다. 또한 발표자가 학생이 아닌 교수님들이었기 때문인지 발표내용과 자료가 깔끔했습니다. 첫날은 내부의 workshop 여러 군데를 전전하며 발표를 들었습니다. 둘째 날은 대부분의 발표를 Closing the Loop Between vision and language라는 세션이 이뤄지는 곳에서 청취했습니다. 제목에서도 드러나지만 NLP와 이미지처리간의 intersection에 관해 논하는 자리였습니다. 학위논문이 그러한 방향이기 떄문인지 큰 관심이 갔었습니다. 잠시 소개된 논문에 대해 소개하겠습니다.

[Text2Scene - Generating Composional Scenes from Textual Descrition.]

제목에서 GAN을 이용했을 거라는 예상을 하게 되는데 그렇지 않습니다. description을 시퀀셜하게 학습하여 그에 해당하는 object, attribute(위치, 크기, 형태 등등)를 sequential 하게 생성합니다. 이 때 sequential 하게 생성되는 object는 각 timestep 마다 scene 의 다른 부분들을 붙여서 장면을 완성하게 됩니다. 해당 모델은 적절한 moidfication 에도 강건하게 object를 생성하는 모습을 보입니다. 해당 발표에서는 장면의 compositionality에 대해서 지속적으로 언급을 하며, description의 변화에 잘 적응하는 연구결과물을 보여줍니다. 이런 composionality를 이용한 방법론은 연상작용에도 적용할 수 있을 거라는 생각이 들었습니다. 인간이 문장과 그 내부의 단어를 이해하는 메커니즘<-> compositional, suquential한 이미지 생성은 연결점이 있을 것이라는 생각이 떠오르지만 아직 더 깊이 있는 사유가 필요할 것 같습니다.

 

10/29~

메인 컨퍼런스는 더 정신이 없었습니다. 앞서 말했 듯이 발표가 짧고 음향장비가 썩 좋지 않아 집중도를 높이기 힘들었습니다. 발표 내용 중 흥미가 생기면 포스터를 보러가거나 논문을 검색하게 되었습니다. Generative Modeling&Synthesis,/ Object detecion, /Vision, Language & Text / 등 여러 세션이 열렸습니다. GAN을 기반으로 한 방법론은 여전히 활발히 연구되고 있는 것으로 보입니다. Best paper 역시 SinGAN 이라는 GAN 기반의 방법론이 있었습니다.

 

[Sin GAN - Learning a Generative Model from a Sigle Nature Image  ]

해당 연구는 하나의 natural image를 통해 generative model을 학습하는 방법론을 제시합니다. 이미지 내부의 patch의 internal 분포를 찾아서 더 좋은 품질의 이미지를 생성합니다. 해당 방법론은 Generator와 Discriminator를 피라미드처럼 쌓아서 실행시켜 patch의 분포를 학습합니다. 이러한 과정을 통해 generator는 새로운 무작위의 사이즈, ratio를 지닌 이미지를 생성할 수 있게 된다고 합니다.

 

이 외에도 포스터 세션에서 수 많은 발표자들이 흥미로운 주제를 선보였습니다. 아직까지 사진만 찍어놓고 읽어보지 못했는데 시간이 날 때 틈틈히 읽어야겠습니다. 좋은 경험이었습니다. 이러한 기회를 주신 교수님께 감사드립니다.
전체 0

전체 181
번호 제목 작성자 작성일 추천 조회
12
2019 International Conf. on Computer Vision - 천우진
관리자 | 2020.03.12 | 추천 0 | 조회 107
관리자 2020.03.12 0 107
11
2019 International Conf. on Computer Vision - 이정호
관리자 | 2020.03.12 | 추천 0 | 조회 59
관리자 2020.03.12 0 59
10
2019 International Conf. on Computer Vision - 정민성
관리자 | 2020.03.12 | 추천 0 | 조회 56
관리자 2020.03.12 0 56
9
2019 International Conf. on Computer Vision - 최종현
관리자 | 2020.03.12 | 추천 0 | 조회 109
관리자 2020.03.12 0 109
8
2019 International Conf. on Computer Vision - 서승완
관리자 | 2020.03.12 | 추천 0 | 조회 60
관리자 2020.03.12 0 60
7
2019 International Conf. on Computer Vision - 최희정
관리자 | 2020.03.12 | 추천 0 | 조회 105
관리자 2020.03.12 0 105
6
2019 International Conf. on Computer Vision - 양우식
관리자 | 2020.03.12 | 추천 0 | 조회 111
관리자 2020.03.12 0 111
5
2019 International Conf. on Computer Vision - 이정훈
관리자 | 2020.03.12 | 추천 0 | 조회 449
관리자 2020.03.12 0 449
4
2019 International Conf. on Computer Vision - 박중민
관리자 | 2020.03.12 | 추천 0 | 조회 87
관리자 2020.03.12 0 87
3
2019 International Conf. on Computer Vision - 김형석
관리자 | 2020.03.12 | 추천 0 | 조회 111
관리자 2020.03.12 0 111

Data Science & Business Analytics Lab.
School of Industrial Management Engineering
College of Engineering, Korea University

Contact Us

  • 강필성 교수 (pilsung_kang@korea.ac.kr)
    서울특별시 성북구 안암로 145 고려대학교 자연계캠퍼스 창의관 801A호 
  • 대학원 연구실 (총무 이유경: yukyung_lee@korea.ac.kr)
    서울특별시 성북구 안암로 145 고려대학교 자연계캠퍼스 신공학관 220호, 221호, 213호
© 2020 DSBA Lab.