본문 바로가기

분류 전체보기207

다시 정리하는 기출문제 [24회 실기] PART1. 기계학습(50) - 메인 데이터 하나로 진행 1. Y(학생들의 결석 횟수) ~ X(부모님 동거여부, 부모님 학벌 클래스, 나이, ...) 1-1. EDA, 전처리 1-1-1. EDA 진행 시각화도 함께 head(data) str(data) #data type sum(is.na(data)) #NA여부 확인 barplot(data$y)#종속변수의 분포 확인 cor(data);plot(cor(data))#x간 상관관계(다중공선성), x,y의 상관관계 1-1-2. 전처리 진행 시각화도 함께. 해당 전처리 과정이 분석 예측 결과에 어떤 영향을 미치는지도 설명 #NA 처리 1) 단순 대치법(completes analysis, 평균 대치법, 단순확률 대치법) 2) 다중 대치법 data$col 2022. 9. 18.
Google Cloud Certified - Professional Machine Learning Engineer 이번엔 팁도 없다ㅜㅜ 그저..thanks to https://geniewishescometrue.tistory.com/category/Certificate/Machine%20learning%20engineer & 링크를 공유해주고 당연히 할 수 있지! 해준 동기 합격 굿즈가 다 있다니..! 쫌 기대했는데 다른 블로그에서 봤던 것과 달리 유일한 굿즈 조끼ㅎ_ㅎ 추석맞이 donation 엔딩..조끼보다 쪼끔 더 멋진 곳에 쓰이렴.. - 인생 계획대로 흘러가지 않지만 계획상으론 2024년이면 놀고 있을 시기인데 자격증 기한이 죄다 24년 초중반에 끝나네ㅜㅜ 2022. 9. 9.
레벨업 lv.2209 1. 느리게 흘러간 달이 없지만 그래도 8월 쏘 시리어스ㅜㅜ삭제 당했네.. 8월 목표 달성률 췤.. ❓1) 근무 시간에 집중 (특히 재택+근무 중에..) ❓2) GCP 공부! + 합! ❌3) 진짜 진짜 시현하다 찍기 (작년 생일선물로 받은건데 한 해하고도 반 년이 지났다.) ❓4) 문장 수집..필사.. 다시 시작할 수 있을까? ❓5) 긍정적인 언어 5점 만점에 3.5점 와중에 온전히 음 구래 이건 내가 증맬 이뤘지!하는게 하나도 없네ㅎㅎ 2. 갑자기 전에 없던 열일 사원이 되었다. 혼자 플젝을 맡아 진행하면서 결정을 내려야할 일도 많아지고 그만큼 내가 전달한 말, 숫자에 책임이 생겼다. 정확하고 구체적으로 답해야하는 것들도 많아졌다. 처음엔 누가 알려준적도 없는 것을 내가 모르는게 왜 내 능력치인건지 잠.. 2022. 9. 1.
z검정, t검정 정리와 기출문제 https://stherhj.tistory.com/150?category=1052148 유의성 검정(Significance Test) 악 작년 이맘때 산업은행 빅데이터직무 셤 볼 때도 똑같이 공부하고 똑같이 오~아~했던 내용ㅠ_ㅠ 실화인가? 유의성 검정 통계치가 모수에 대한 예측과 다르게 나왔을 때, 1) 통계치가 우연임(H0) stherhj.tistory.com https://stherhj.tistory.com/159?category=1052148 T-TEST|ANOVA|상관분석 먼저 각 변수간의 등분산성을 확인한다. H0: 집단간의 분산이 동일하다. H1: 집단간의 분산이 동일하지 않다. p-value가 유의수준 0.05 보다 크면 귀무가설을 기각하지 못하여 등분산성 만족 var.test(Sa sth.. 2022. 8. 29.
시계열 분석(2) : 일보전진 이보후퇴 왠지 모르게 공부하면 공부할 수록 더 모르겠는 시계열 분석 재정리 이전에 정리했던 기본 내용: https://stherhj.tistory.com/160?category=1052148 시계열 분석 항상 나오기만하면 눈감고 저리가!!했던 시계열 분석..이젠 어쩔 수 없다ㅠㅠ친하게 지내보자.. 시계열 데이터 구성 요소(original=trend+seasonal+random) 1. 추세변동(trend), 2. 순환변동(cycle), 3. 계절변동 stherhj.tistory.com ARIMA의 input data format? ("정상성 데이터: ARIMA 모형을 적용하기 위한 조건" → 정말 그러한가..?) [!] ARIMA : AR(자기상관: 과거 관측값을 통해 예측 모델 생성 *다중 회귀 모형과의 차이: .. 2022. 8. 26.
7월 안녕~ 8월 더 안녕! 1. 먼저 다시 돌아보는 7월의 목표 ⭕️1) 파이참 친해지기 ❌2) 추가로 토치랑 친해지기.. ⭕️3) 더 급하게 tensorflow랑 친해지기..(7/1 셤!) - cuda 확인 ⭕️4) 보험 / 청약 ✍🏻 ❌5) 추가로 하우스 확인 ❌6) 코드 모듈화 ⭕️7) 베이스라인 코드 수정 사항 ❌8) 포스트 시즌 예측 모형 ❌9) 특허 ❌10) 필사 (5월 책 이야기 마저 작성, 6월 책 마무리) 10점 만점에 4점 받으셨습니다..큰일이십니다.. 2. 정들었지만 조금 시들했던 승부 예측을 잠시 접어두고 기대하던 새로운 프로젝트를 만났다! 입사 전부터 해보고 싶었던 분야+궁금했던 데이터셋도 만져볼 수 있을 것 같아 기대되면서도 PJM을 맡아서 걱정도 되고..꼬맹 사원 탈출에 더 힘써야겠다. 3. 무관하게 A.. 2022. 7. 31.