본문 바로가기

1-1. 지도학습 (이산자료)4

R 서포트 벡터 머신 예시 (대장암 예시) 먼저 아래 패키지를 설치합시다. install.packages("survival") survival 패키지에는 대장암 데이터인 colon 데이터가 들어 있습니다. 패키지를 불러옵니다. library(survival) 데이터를 변수에 저장해줍니다. data=colon 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 str함수를 이용하여 변수들을 살펴봅시다. > str(colon) 'data.frame':1858 obs. of 16 variables: $ id : num 1 1 2 2 3 3 4 4 5 5 ... $ study : num 1 1 1 1 1 1 1 1 1 1 ... $ rx : Factor w/ 3 levels "Obs","Lev","Lev+5FU": 3 3 3 3 1 1 3 3.. 2023. 7. 27.
R 로지스틱 회귀분석 예시 (대장암 예시) 먼저 아래 패키지를 설치합시다. install.packages("survival") survival 패키지에는 대장암 데이터인 colon 데이터가 들어 있습니다. 패키지를 불러옵니다. library(survival) 데이터를 변수에 저장해줍니다. data=colon 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 str함수를 이용하여 변수들을 살펴봅시다. > str(colon) 'data.frame':1858 obs. of 16 variables: $ id : num 1 1 2 2 3 3 4 4 5 5 ... $ study : num 1 1 1 1 1 1 1 1 1 1 ... $ rx : Factor w/ 3 levels "Obs","Lev","Lev+5FU": 3 3 3 3 1 1 3 3.. 2022. 11. 23.
R 랜덤포레스트 예시 (신용등급예시) 먼저 아래 패키지를 설치합시다. install.packages("randomForest") install.packages("caret") randomForest 패키지에는 의사결정나무 함수가 들어있습니다. caret 패키지에는 예시에 사용할 데이터가 들어 있습니다. 패키지를 불러옵시다. library(caret) library(randomForest) 데이터를 불러오고 변수에 저장해줍니다. data(GermanCredit) data=GermanCredit 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 데이터가 굉장히 방대하기 때문에 일부만 추려서 살펴보겠습니다. > data[1:5,7:10] NumberPeopleMaintenance Telephone ForeignWorker Class .. 2022. 11. 23.
[R 머신러닝] "K-최근접 이웃" #1. 개념 [R 머신러닝] "K-최근접 이웃" #1. 개념 목차는 아래와 같습니다. 1. 개념2. 알고리즘3. R 함수 설명4. R 코딩 예제 K최근접 이웃은 분류나 회귀에서 사용되는 머신러닝 방법입니다. 분류가 더 이해하기 쉽기 때문에 먼저 분류에 사용되는 경우부터 설명드리겠습니다. 분류는 데이터가 어떤 종류인지를 결정하는 것입니다. 예를들면 A라는 과일이 오렌지인지 사과인지를 분류하는 것입니다. k최근접이웃은 이름에서 알 수 있듯, 가장 가까이 있는 이웃의 데이터 종류가 분류 기준이 됩니다. A라는 과일이 오렌지와 가까이 있으면 오렌지가되고 사과와 가까이 있으면 사과가 됩니다. 가까이 있다는 것이 무엇일까요? 가깝고 멀고에서는 어떤 변수가 기준이 됩니다. 무게 일수도 있고 부피일 수도 있고 색일 수도 있습니다... 2020. 9. 25.