전체적으로 짧게 요약하자면, few-shot으로부터 학습하기 위해 meta적인 파라미터를 학습시켜놓는 것이며, 이를 알고리즘으로 표현한 것이다.
즉 위 그림처럼 Distribution of Task T에 대하여 메타적인 파라미터 세타가 있으면, 특정 Task Ti에 대해서 몇 개의 데이터(supervised) 혹은 탐험(강화학습)으로부터 얻어낸 로스를 활용하여 Task Ti에 맞는 파라미터 세타i가 될 수 있게끔 하는 것이다.
이를 대략적인 알고리즘으로 나타내면 아래와 같다.
대략적으로 단계를 표현하면,
1) 특정 Task에 맞게끔 로스를 이용하여 세타i 를 구해낸다.
2) 세타i가 정말 특정 Task에 맞는지 로스를 구해 세타를 수정한다.
이를 supervised나 강화학습에 구체화시키면 아래와 같다.
이 논문에서 실험한 내용 중 인상깊은 내용은 Supervised 관련 부분이다.
간단한 Regression 메타 러닝에 대한 실험이었다.
sinusoid 모양의 함수를 모델이 파악할 수 있으면 된다.
비교 대상은 1) MAML로 학습한 모델 2) 하나의 sinusoid에 대해 pretrain된 모델 이다.
두 모델이 얼만큼 빨리 특정 모델로 변할 수 있는가를 테스트한다.
MAML 모델의 pre-update 모양은 정확한 sinusoid 모양은 아니지만, 특정 모양으로 굉장히 빠르게 변하는 것을 확인할 수 있다.
이는 meta적으로 sinusoid 모양을 학습한 것이라고 볼 수 있다.
반면 pretrain 모델은 GT 모양에 맞게끔 fine-tuning 되는 것이 쉽지 않아보인다.
결론적으로 든 생각은 MAML 알고리즘을 활용하여 다양한 부분의 메타 러닝에 접목할 수 있겠다는 것이다.