From recognition to cognition: Visual commonsense reasoning 논문에서 처음 제시된 task.

특정 상황에 대한 이미지와 이에 대한 질문이 주어지면, 정확한 대답과 함께 정당한 근거를 제시해야 하는 task.

Given an image, a machine must answer a question that requires a thorough understanding of the visual world evoked by the image. Moreover, the machine must provide a rationale justifying why that answer is true.

Untitled

Reference

[VCR] From Recognition to Cognition: Visual Commonsense Reasoning 논문 이해