Semantic Textual Similarity 두 문장의 유사도를 1~5까지로 regression하는 task. 약 8.5k 정도의 규모로, 소스는 이미지 캡션, 뉴스 제목, 위키 추출 등 8개 도메인