Semantic Textual Similarity

두 문장의 유사도를 1~5까지로 regression하는 task.
약 8.5k 정도의 규모로,
소스는 이미지 캡션, 뉴스 제목, 위키 추출 등 8개 도메인