본문 바로가기

딥러닝

(11)
빅데이터,스트림데이터 in Python 파이썬은 인공지능(머신러닝,딥러닝)에서 굉장히 Hot 한 언어이다. 벡터,행렬 같은 머신러닝에 필요한 연산들을 제공해주는 라이브러리가 있기 때문에 , 그래프를 시각화해서 볼 수 있기 때문에, 이를 기반으로 여러 딥러닝 프레임워크들이 제공 되어진다. 딥러닝이 머신러닝에 비해 본격적으로 주목을 받게 된것은 빅데이터에서의 퍼포먼스가 머신러닝 보다 더 뛰어나다는 연구결과가 있고 나서이다. 그리고, 현재 딥러닝 프로세스는 한번에 데이터를 저장한 다음에 처리하는 것이 아니라 , 지속적으로 데이터가 들어오면서 동시에 처리하고 이를 학습에 사용하는 Cycle의 형태이기 때문에 , 스트림 데이터에 대한 취급도 중요합니다. (본 글은, 빅데이터 스트림 데이터에 대한 개념이 있다 가정하고 진행) 즉, 파이썬에서 빅데이터,스..
딥러닝에서의 파이썬 위 카테고리는 단순 파이썬이 아닌 딥러닝관점에서 왜 파이썬이 좋은지 알아보는 카테고리이다.
1강- 확률과 셈 원리 (Probability and Counting) 수강 일자: 07월 20일 머신러닝 공부는 이론보다는 프로젝트를 통해서 코딩하는 법을 익히는 것이 중요하다고 합니다. 하지만, 가장 기본적인 classification 도 남들이 만들어 놓은 결과를 그대로 가져다 쓸 뿐입니다. 예를 들어 , softmax는 Label 수만큼의 결과를 가지고 있고 , 더한 값은 1이 되는 확률 값입니다. *그냥 그렇다고 넘어가고 , 자세히 설명해주진 않습니다. * 인공지능 , 특히 딥러닝 알고리즘에서 특징을 추출한 다음에 결과 도출은 확률론에서 나온 이론을 사용합니다. 이번 확률론을 공부하면서 인공지능에서 Black Box로 여기던 부분을 더 파헤쳐 보겠습니다 Statistics 110 1강입니다. 확률론의 활용영역: 유전학, 물리학, 계랑 경제학, 금융, 역사학, 정치 ..
Mnist를 이용한 face_verification 기존의목표 이미지 데이터를 배치 데이터로 semi triplet hard 방식으로 학습을 시키는 것이 목표엿습니다. 그러기 위해선, 사람의 얼굴을 개인별로 라벨링을 해줘야할 필요가 있습니다. 하지만, 최소 3~4천장의 얼굴을 라벨링하고 사람마다 20장 정도를 구성해야 필요가 있습니다. 시간적 , 비용적 한계에 부딪혓습니다. 따라서, 이미지 데이터 특성상 Fine_Tuning의 효과가 크므로 , Pre_trained 모델을 찾아보고자 했습니다. 결국 , 사용할 수 있는 모델을 찾지 못했습니다. 여기서, 한가지 떠올렸습니다. 우리가 하고자 하는것은 유사도 함수를 통하여 Clustering을 하는것. 어떤 이미지 데이터를 써도 상관 없을것. Mnist 데이터를 input으로 줘서 유사도 함수를 학습하면 어떨까..
DCGAN 회의날짜:05/15 장소:온라인 ※제가 소모임에서 했엇던 활동을 제 개인 블로그에 다시업로드 한 것입니다 1.Introduction 2.Related Works 3.Approach and Model architecture 1.Introduction ->1.간의 결과는 불안정하다. ->2.어떠한 방법으로 이미지를 생성햇는지 알수없어서 filter visualize를 할 것이다. 2.Related works ->1.Representational Learning from unlabeld data ->2.Generating natural images ->3.visualizing 3.Approach and model architecture ->1.strided convolution ->2.fully connect..
DeeplabCut 사용하는법 진행기간:19년 11월 16~20일 안녕하세요 이전에 제가 DeepLabcut, Leap 프레임워크를 소개하는 글을 올렸습니다. 이번에는 Deeplabcut라이브러리를 어떻게 사용하는지 알아 보도록 하겠습니다. https://github.com/AlexEMG/DeepLabCut/blob/master/conda-environments/README.md 위의 github를 clone 해주도록 합니다.(우선 로컬에서 진행합니다.) 우선 readMd에 나와있는대로 , 가상환경 하나를 다운받아줍니다. Creating Project Ln[0] : activate dlc-windowsCPU Ln[1] : Import deeplabcut Ln[2] : Deeplabcut.create_new_project(이름 , 훈련..
DeepLabCut, Leap 조사일시:19년10월31일~19년11월6일 Animal Pose_estimation을 위한 여러라이브러리를 조사한 적이 있습니다. Leap 동물중 특히 , 강아지를 Pose_estimation하기 위한 방법을 찾았습니다. 우선 Leap이라는 프레임 네트워크가 있습니다. 위기사는 2018년 12월 Nature 기사입니다. Fast animal pose estimation 검색을 하는데 Leap를 소개 해주길래 알게 되었습니다. 개발환경 Python : 3.6.4 Anaconda : 5.1.0 MatLab : MATLAB R2018a Python : OpenCv3 개발환경 요구사항은 위와같이 됩니다. Input Data 확장자 : h5(HDF5) 이유: 모든 language 와 environment 에서 지..
Bert로 학습해보기 기간:20년5월21일 ~6월 16일 ※예전에 진행했던 프로젝트를 지금에서야 정리해서 올립니다. 안녕하세요 ~!. 굉장히 오랜만에 글을 작성하네요 코로나19덕에 학기가 굉장히 루즈하고 늦게 끝나서 집중하지 못했습니다. 이제부터는 블로그에 좀더 집중 할수 있도록 하겠습니다. Bert를 학습시키는 과정은 아래와 같은 과정을 거쳐서 진행합니다. Tpu를 사용할 것인가? Yes: GCs에 데이터를업로드해야만한다. No:구글드라이브에 업로드한다. Pretraining_data를 GoogleCloud에 업로드해준다 Vocab을 만들어준다 1. lovit의 wordpiece 코드참조 2. 구글 센텐스피스 라이브러리참조 데이터 전처리 Tf.record타입으로변환 Pre_training모델을 만들어준다. 우선 Bert를 ..