본문 바로가기

데이터제작

(3)
Pilot Tagging Pilot Tagging은 Guide Line을 더 잘 작성하기 위해서 labeler들이 미리 사전에 sample data에 대해 라벨링을 해보고 일치 여부를 PE,PA, Fleisis's Kappa를 이용해 계산하는 것입니다. 라벨링의 불일치가 많이 나오는 부분에 대해서 회의를 통해 GuideLine에서 수정할 부분이 있으면 수정하는 과정입니다. 이 수식을 통해 무언가를 해석하기 보다는 일관성 있는 labeling을 위하여 GuideLine을 정교하게 만드는 과정이라고 생각합니다.
TagTog Result TagTog로 annotation을 하면 끝난게 아닙니다. IAA 를 계산하기 위해선 , id, text ,subj,obj, label의 schema 형태의 파일로 저장을 해주어야 합니다. TagTog의 output은 json파일 인데 , 각각의 key 가 어떤 것을 의미하는지 살펴보도록 하겠습니다. anndoc format · tagtog anndoc format anndoc is a standoff format for document annotations consisting of two files: File Description ann.json Annotations-only, part of the format. plain.html Content-only, part of the format. {% ca..
Tagtog 2021-11-16 내용 추가(labeling 1:N 관계) , 마무리 수정 Relation Data를 제작하는 tool중의 하나인 Tagtog를 소개할려 한다. tagtog · AI-enabled Text Annotation Tool | PDF, Markdown, CSV, html, tweets, & many more Document types tagtog · AI-enabled Text Annotation Tool | PDF, Markdown, CSV, html, tweets, & many more Document types The Text Annotation Tool to Train AI. — Web Based & Multi User. Cloud & On-Premises. Secure. — Star..