본문 바로가기

머신러닝5

R 서포트 벡터 머신 예시 (대장암 예시) 먼저 아래 패키지를 설치합시다. install.packages("survival") survival 패키지에는 대장암 데이터인 colon 데이터가 들어 있습니다. 패키지를 불러옵니다. library(survival) 데이터를 변수에 저장해줍니다. data=colon 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 str함수를 이용하여 변수들을 살펴봅시다. > str(colon) 'data.frame':1858 obs. of 16 variables: $ id : num 1 1 2 2 3 3 4 4 5 5 ... $ study : num 1 1 1 1 1 1 1 1 1 1 ... $ rx : Factor w/ 3 levels "Obs","Lev","Lev+5FU": 3 3 3 3 1 1 3 3.. 2023. 7. 27.
[R 머신러닝] "K-최근접 이웃" #1. 개념 [R 머신러닝] "K-최근접 이웃" #1. 개념 목차는 아래와 같습니다. 1. 개념2. 알고리즘3. R 함수 설명4. R 코딩 예제 K최근접 이웃은 분류나 회귀에서 사용되는 머신러닝 방법입니다. 분류가 더 이해하기 쉽기 때문에 먼저 분류에 사용되는 경우부터 설명드리겠습니다. 분류는 데이터가 어떤 종류인지를 결정하는 것입니다. 예를들면 A라는 과일이 오렌지인지 사과인지를 분류하는 것입니다. k최근접이웃은 이름에서 알 수 있듯, 가장 가까이 있는 이웃의 데이터 종류가 분류 기준이 됩니다. A라는 과일이 오렌지와 가까이 있으면 오렌지가되고 사과와 가까이 있으면 사과가 됩니다. 가까이 있다는 것이 무엇일까요? 가깝고 멀고에서는 어떤 변수가 기준이 됩니다. 무게 일수도 있고 부피일 수도 있고 색일 수도 있습니다... 2020. 9. 25.
[R 딥러닝 예제] 표준정규분포함수 만들기 #3. 학습결과 평가하기 #3. 학습결과 평가하기 우리가 예측한 결과가 잘 맞는다는 것을 어떻게 확인할 수 있을까요. 먼저 실제 output과, 계산된 output 데이터를 가져옵시다. 지난시간까지 만든 코드를 실행하면 됩니다. 코드는 아래와 같습니다. library(neuralnet) #data 생성set.seed(1)input=rnorm(1000)output=dnorm(input) #train 데이터를 배정합니다.input_train=input[1:500]output_train=output[1:500] #test데이터를 배정합니다.input_test=input[501:1000]output_test=output[501:1000] #train 데이터 input,output을 하나의 행렬로 묶기my_data_train=cbind(.. 2019. 12. 14.
[R 딥러닝 예제] 표준정규분포함수 만들기 #2. 학습결과 확인하기 #2. 학습결과 확인하기 우리는 지난시간에 아래와 같은 train 데이터와 test 데이터를 정의했습니다. library(neuralnet) #data 생성set.seed(1)input=rnorm(1000)output=dnorm(input) #train 데이터를 배정합니다.input_train=input[1:500]output_train=output[1:500] #test데이터를 배정합니다.input_test=input[501:1000]output_test=output[501:1000] #train 데이터 input,output을 하나의 행렬로 묶기my_data_train=cbind(input_train,output_train) input_train과 output_train 데이터를 이용하여 신경망을 학.. 2019. 12. 14.
[R 딥러닝 예제] 표준정규분포함수 만들기 #1. neuralnet 패키지로 신경망 만들기 #1. neuralnet 패키지로 신경망 만들기 딥러닝을 이용하여 표준정규분포함수를 학습시켜보려고 합니다. 먼저 패키지를 설치해야하는데요. neuralnet 패키지를 사용할겁니다. 아래와 같이 패키지를 설치합니다. install.packages("neuralnet") neuralnet 라이브러리를 호출하고 데이터를 생성합니다. library(neuralnet) #data 생성 set.seed(1) input=rnorm(1000) output=dnorm(input) rnorm함수는 정규분포의 확률변수를 임의로 추출해주는 함수입니다. 확률분포값을 이용하여 변수를 추출하므로, 확률분포 값이 클 수록 추출될 확률이 높습니다. 디폴트 값이 평균 0, 표준편차 1 이므로, 표준정규분포에서 확률변수가 추출됩니다. 확.. 2019. 12. 13.