본문 바로가기

쫌쫌따리 통계+데이터+AI29

베이지안 정리 [ADP 24회] 베이지안 확률 : 코로나 유병률이 0.01일 때 키트가 양성 떴는데 바이러스에 실제로 감염되었을 베이지안 확률 (민감도=TP/(TP+FN)=P(B|A)) = 370/385 (특이도=TN/(FP+TN)=P(B^c|A^c)) = 690/700 베이즈 정리 i = 1 P(바이러스 감염|키트 양성) = ( P(키트 양성|바이러스 감염) * P(바이러스 감염) ) / ( P(키트 양성|바이러스 감염) * P(바이러스 감염) + P(키트 양성|바이러스 미감염) * P(바이러스 미감염) ) = ( P(키트 양성|바이러스 감염) * 0.01) / ( P(키트 양성|바이러스 감염) * 0.01 + P(키트 양성|바이러스 미감염) * 0.99 ) = (민감도 * 0.01) / (민감도 * 0.01 + (.. 2022. 6. 10.
알고리즘 성능 평가와 시각화(작성중) *회귀분석 성능 평가를 위해 train, test set을 나눌 필요가 있나? classification은 꼭 나눠야 한다고 생각. *회귀분석을 통해 미래를 예측하나? ->이 땐 test set 확보를 통해 모델이 특정 데이터셋에 overfitted 되어있지 않음을 확인(그럼에도..예를 들어 18~20년 train set 21년 test set을 통해 확인하면서 hyperparameter 최적화를 한다면 21년 set에 너무 적합한거 아님? 22년 예측에 잘 활용될 수 있을까?) *회귀분석에 iteration 필요? 그냥 한 번 돌릴 땐 몇 번의 iteration을 돌린거지 #Step 1 - create the evaluation metrics function eval_metrics = function(.. 2022. 6. 8.
Regression Algorithms 연속형 데이터(Y)에 대한 회귀하면 선형 회귀(좀 더 나아가봐야 비선형 회귀..)에 그쳐 당황했던 기억으로 작성하는 회귀 머신러닝 알고리즘 종류 #데이터 기본 준비과정 library(plyr) library(readr) library(dplyr) library(caret) library(ggplot2) library(repr) dat 2022. 6. 8.
EDA(Exploratory Data Analysis) vs 전처리 EDA 데이터 분석을 통한 결과값을 출력하기 전에 어떤 결과값을 낼 지 가설을 갖고 사전검증 하는 과정(시각화 수반) 1. 데이터의 column 의미를 훑으며 파악 getwd() src_dir 2022. 6. 8.
AWS Machine Learning Specialty 10시간 호다닥 합격 정보란 0.1도 없는 낙서 블로그지만 이 시험만큼은.. 준비하면서 블로그나 정보가 많이 없어 회사에서 귀동냥으로 쫌쫌따리 얻어 보았기 때문에 스스로 남기기로 결심! 그치만 여전히 구구절절의 습관은 버리지 못하였고 깔끔명료의 정보전달은 없음ㅎㅎ 그래도 한 명 이상에게..도움이 되길.. 1. 접수, 시험비용, 온오프라인 응시 -우선 셤은 여기서 등록하면 되는데 원래 AWS 계정이 있으면 그걸로 바로 등록 가능하다. https://aws.amazon.com/ko/certification/certified-machine-learning-specialty/ AWS Certified Machine Learning - Specialty 자격증 | AWS Certification | AWS 다음 권장 교육 과정을 통해.. 2022. 4. 17.
24회 ADP 데이터 분석 전문가 실기 (22/03/26) 반성 시간의 이유..6월에 다시봐야하기 때문이다ㅋㅁㅋ 공부하다보면 한 발자국만 더 나가면 뭐라도 될 것 같다가도 이것저것이 전부 섞여서 뭐 하나도 제대로 세워져있는게 없는 것 같기도하다. 당초 목적대로 조금이나마 계속 공부할 동기 부여가 되었으니 그것으로 된 것 같기도.. 이미 쪼렙티가 난 것이 나는 코드 정리해서 제출하는 형식인줄 알았는데 코드는 확인도 안하고 그냥 결과값 정리하고 (코드는 필요시에만) 워드파일-pdf저장해서 하나로 제출하는 것이었다. 그만큼 통계지식을 더 보는 느낌.. 머리엔 든 것 없이 가볍고 마음과 어깨만 무거운 오픈북 시험이었다. 사람들 캐리어 끌고 온대서 나도 한가득 가져갔는데 막상 다들 가볍게 백팩하나 매고와서 두 개나되는 내 가방이 쫌 부끄러웠다(그 책들 내용을 한 번이라도.. 2022. 3. 26.