분류 전체보기207 변수 선택법 독립변수의 수가 많아지면 모델의 복잡도가 올라가며 성능이 올라가지만 너무 많아지면 그 성능이 낮아진다. 학습성능이 높아지더라도 예측성능이 떨어질 수 있다(과적합이슈). either feature selection or feature extraction Feature Selection 1. Filter: 1:1 상관관계 확인, 주관적 판단 (특히 요즘 비추하는 추세 업계 짬 신뢰도 2022. 3. 11. T-TEST|ANOVA|상관분석 먼저 각 변수간의 등분산성을 확인한다. H0: 집단간의 분산이 동일하다. H1: 집단간의 분산이 동일하지 않다. p-value가 유의수준 0.05 보다 크면 귀무가설을 기각하지 못하여 등분산성 만족 var.test(Sales~Urban, data=car, alternative="two.sided") 종속변수(Y)가 연속형이고 ~ 독립변수(X)가 범주형이며 1) 독립변수 X가 이항변수일 때 : t-test H0: X 여부에 따른 Y의 차이가 없다. H1: X 여부에 따른 Y의 차이가 있다. t.test(Sales~Urban, data=car, alternative="two.sided", var.equal=TRUE) 2) 독립변수 X가 3개 이상의 범주를 가질 때 : ANOVA (1) Y와의 관계를 확인하고.. 2022. 3. 11. [2월 독서] 팩트풀니스 (한스 로슬링) 책 자체는 처음 읽어보았지만 대학원 때 동기가 옆에서 읽는 것을 보고 앞페이지 퀴즈를 풀어보고 거의 모든 문제를 틀렸던 기억이 있다. 이번에는 전자도서관에 책이 없어 직접 구 도서관에서 책을 빌렸는데 알고보니 '구민 한 책 읽기' 선정 책이었다. 대학원 동기도 읽고 구민들도 읽고 이거 나 빼고 다 읽은거 아녀~? 책 내용: 간극본능("높은 건물 꼭대기에서 아래를 내려다보면 자그마한 건물들의 차이를 식별하기 어렵다."), 부정본능, 직선본능, 공포본능, 크기본능, 일반화본능, 운명본능, 단일관점본능, 비난본능, 다급함본능에 의한 세상에 대한 사실과 다른 인식과 이로 인한 잘못된 판단들. 암튼 세상은 너네가 편협하게 오해한 것과는 달리 더 나은 방향으로 나아가고 있어~하는 이야기 책 전반에서 전달하고자 하는.. 2022. 3. 7. [HSK 5] 27강. 문제풀이 (듣기 제 1, 2부분) (22/03/06 일) ㅜㅜ당연히 데이터 공부는 할 것 같고 바쁘면 중국어를 놓을 것 같아서 맨날 hsk 인강들은걸로 스터디 인증을 하니까 쓸데없이 꾸준히 중국어 공부를 하게되네..내일부터는 ADP 실기 문제 풀이로 인증해야게따..흑흑 2022. 3. 7. [HSK 5] 26강. 대화형 (날씨/교통) (22/03/04 금) 2022. 3. 7. [HSK 5] 25강. 대화형 (주거/음식) (22/03/03 목) 2022. 3. 7. 이전 1 ··· 10 11 12 13 14 15 16 ··· 35 다음