[논문 리뷰] Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

2019. 11. 12. 00:58

전체적으로 짧게 요약하자면, few-shot으로부터 학습하기 위해 meta적인 파라미터를 학습시켜놓는 것이며, 이를 알고리즘으로 표현한 것이다.

즉 위 그림처럼 Distribution of Task T에 대하여 메타적인 파라미터 세타가 있으면, 특정 Task Ti에 대해서 몇 개의 데이터(supervised) 혹은 탐험(강화학습)으로부터 얻어낸 로스를 활용하여 Task Ti에 맞는 파라미터 세타i가 될 수 있게끔 하는 것이다.

이를 대략적인 알고리즘으로 나타내면 아래와 같다.

대략적으로 단계를 표현하면,

1) 특정 Task에 맞게끔 로스를 이용하여 세타i 를 구해낸다.

2) 세타i가 정말 특정 Task에 맞는지 로스를 구해 세타를 수정한다.

이를 supervised나 강화학습에 구체화시키면 아래와 같다.

이 논문에서 실험한 내용 중 인상깊은 내용은 Supervised 관련 부분이다.

간단한 Regression 메타 러닝에 대한 실험이었다.

sinusoid 모양의 함수를 모델이 파악할 수 있으면 된다.

비교 대상은 1) MAML로 학습한 모델 2) 하나의 sinusoid에 대해 pretrain된 모델 이다.

두 모델이 얼만큼 빨리 특정 모델로 변할 수 있는가를 테스트한다.

MAML 모델의 pre-update 모양은 정확한 sinusoid 모양은 아니지만, 특정 모양으로 굉장히 빠르게 변하는 것을 확인할 수 있다.

이는 meta적으로 sinusoid 모양을 학습한 것이라고 볼 수 있다.

반면 pretrain 모델은 GT 모양에 맞게끔 fine-tuning 되는 것이 쉽지 않아보인다.

결론적으로 든 생각은 MAML 알고리즘을 활용하여 다양한 부분의 메타 러닝에 접목할 수 있겠다는 것이다.

'AI > 논문 리뷰' 카테고리의 다른 글

[논문 리뷰] One-Shot Visual Lmitation Learning via Meta-Learning (1)	2019.10.28
[논문 리뷰] Leveraging Grammar And Reinforcement Learning For Neural Program Synthesis (0)	2019.10.21
[논문 리뷰] Neural Architecture Search with Reinforcement Learning (0)	2019.10.07
[논문 리뷰] Neural Task Programming: Learning to Generalize Across Hierarchical Tasks (0)	2019.10.04
[논문 리뷰] Neural Programmer-Interpreter (0)	2019.10.01

꾸준히 걷는중

[논문 리뷰] Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

'AI > 논문 리뷰' 카테고리의 다른 글

+ Recent posts

티스토리툴바