본문 바로가기

분류 전체보기

(89)
TagTog Result TagTog로 annotation을 하면 끝난게 아닙니다. IAA 를 계산하기 위해선 , id, text ,subj,obj, label의 schema 형태의 파일로 저장을 해주어야 합니다. TagTog의 output은 json파일 인데 , 각각의 key 가 어떤 것을 의미하는지 살펴보도록 하겠습니다. anndoc format · tagtog anndoc format anndoc is a standoff format for document annotations consisting of two files: File Description ann.json Annotations-only, part of the format. plain.html Content-only, part of the format. {% ca..
GCP professional certificate 시험 후기 필자는 2021년 11월 12일날 Data engineer 시험을 보았습니다. 필자는 시험을 보면서 느닷없이 suspended 되는 상황을 맞이했으나, 구글 클라우드에 문의후 suspended 되기전에 다 풀었던 답을 강제로 제출했고, Pass 판정을 받았습니다.(certificate 발급은 7일정도가 걸린다고 합니다.) 정말 다행이지만, 이러한 이유가 발생한 이유를 Google Cloud에 문의를 하였고 , 그 이유와 시험 과정을 적어보고자 합니다. 1.Kryterion Webassessor 접속 Logged out (webassessor.com) Logged out You are logged out. Thank you for using Webassessor! To log back in, click t..
Resume,CV,Portfolio,자기소개 요새 취업시즌이 다가오면서 resume, cv, portfolio를 다시 작성하거나 혹은 새로작성하는 상황이 발생한다. 저는 여태까지 resume=cv , portfolio 이렇게 생각을 하고 있었는데, 그게 아니였습니다. resume resume는 자신이 어떤 경력을 가지고 있는지 말하는 것이다. 자신이 어떤 경험을 했고 어떤 수상을 했으며 어떤 직장을 다녓는지 등등을 적는 것이다. 자신이 어떤일을 했는지를 적는게 핵심이다. 1장안에 JD에 맞춰서 자신의 이력을 잘 적어야한다. CV cv는 curriculm viate 의 약자이다. viate는 인생 이라는 뜻을 가진 라틴어입니다. 자신이 어떻게 인생을 살아왔는지를 표현하는 것입니다. 자신이 경험했던 것, 프로젝트 등등을 자세하게 적어야합니다. 하지만,..
Tagtog 2021-11-16 내용 추가(labeling 1:N 관계) , 마무리 수정 Relation Data를 제작하는 tool중의 하나인 Tagtog를 소개할려 한다. tagtog · AI-enabled Text Annotation Tool | PDF, Markdown, CSV, html, tweets, & many more Document types tagtog · AI-enabled Text Annotation Tool | PDF, Markdown, CSV, html, tweets, & many more Document types The Text Annotation Tool to Train AI. — Web Based & Multi User. Cloud & On-Premises. Secure. — Star..
Matrices and vectors and simultaenous equation 이 게시물은 Coursera의 mathmatics for Machine Learning 을 듣고 정리한 필기 내용입니다. 저희가 슈퍼에서 apple과 banana를 사러 갔습니다. 2개의 apple과 3개의 banana를 샀고 8$를 지불했습니다. 그리고 , 옆에 있던 사람이 10개의 apple과 1개의 banana를 샀고 13$를 지불 했습니다. 이를 아래와 같이 simultaneous equation으로 표현할 수 있습니다. 이를 전개해서 해를 구할수 도 있지만 이는 matricies form으로 나타낼 수 있습니다. 이 matricies가 의미하는것은 basis vector e1,e2 를 transform 시키는 것입니다. 아래와 같이 basis vector e1,e2 과 e1` e2`으로 이동합니..
15주차 주간학습정리 이번주 내내 gcp data engineer 시험을 보기위한 공부만을 하였다. 오늘 1시에 시험을 보았는데 , assesement가 1시간 남기고 suspended 되어서 멘탈이 승천했다. kryterion에서 해결 해줄 수있는게 아니고 구글 클라우드의 답변을 기다려야 하기에 , 상당히 난감한 상황이다. 시험 문제를 다풀고 확신했지만, 검토를 들어 갔는데, suspended 되어서 약간 기분이 되게 별로입니다. 이번 주는 멘탈을 자 추스를 수 있을지 는 모르겠습니다. 문제은행의 문제를 여러번 풀면서 답체크를 한 스프레드시트를 뷰어권한으로 공유합니다. https://docs.google.com/spreadsheets/d/1np2yciA5_eQMsr_RZSsDrXknVt5xT_s_sjjEjBf_fbA/edi..
DL engineer에게 필요하다고 생각하는것 DL engineer들의 수요는 점점 올라가고 있는 추세입니다. 그로 인한 , 여러 교육 프로그램으로 많은 engineer 들이 쏟아져 나오고 있습니다. 그로인해 , 양산형 Portfolio는 점점 더 쏟아져 나오고 있습니다. 현업에서, AI 기업 Head로 있으신 분의 말을 빌리자면, 양산형 Portfolio는 자세하게 보지 않게 된다고 합니다. 교육 , 정말 좋습니다. 2500만원 짜리 교육을 0원에 해주는 곳도 있는데요. 교육에서 요구하는 것을 전부 완벽하게 할 수 있다면, 취업은 무조건 될거라 생각합니다. 명심할점은 , 요구는 누구나 할 수 있으니까요 ~. 딥러닝 엔지니어에게 필요한 역량을 여기 일일이 적는건 무의미합니다. 어차피 구글링해서, 공통점을 추려보면 쉽게 알 수 있습니다. 구글링으로 얻..
빠른 개발을 위해서 깨달은것 2021-10-30 수정 2021-10-31 수정 ML workflow 관점에서 볼 때 , 저의 문제점은 단 방향 개발만 가능하고 , 순환적인 개발흐름(?) 이 익숙하지 않다는 것을 깨달았습니다. ML workflow에서 데이터수집, 가공 , 모델개발, Train, Test (배포,문제정의는 일단 제외하겠습니다.) 이 흐름이 한방향으로 진행되고 끝나는게 아니라 , 순환적인 구조로 계속 반복이 됩니다. 후진 없이 직진만 하는것은 , 숙달이 되었다고 생각합니다. 하지만, 뒤로 갔다가 앞으로 갔다 이를 계속 반복하는 과정에서 버벅거림이 있다는것을 느꼇습니다. Boostcoure KLUE RE, MRC를 진행하면서 , 두번 다 비슷하게 baseline과 다른 모델을 시도하는 역할을 하게 되었고, RE에서는 어느..