본문 바로가기

r6

R 서포트 벡터 머신 예시 (대장암 예시) 먼저 아래 패키지를 설치합시다. install.packages("survival") survival 패키지에는 대장암 데이터인 colon 데이터가 들어 있습니다. 패키지를 불러옵니다. library(survival) 데이터를 변수에 저장해줍니다. data=colon 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 str함수를 이용하여 변수들을 살펴봅시다. > str(colon) 'data.frame':1858 obs. of 16 variables: $ id : num 1 1 2 2 3 3 4 4 5 5 ... $ study : num 1 1 1 1 1 1 1 1 1 1 ... $ rx : Factor w/ 3 levels "Obs","Lev","Lev+5FU": 3 3 3 3 1 1 3 3.. 2023. 7. 27.
R 랜덤포레스트 예시 (신용등급예시) 먼저 아래 패키지를 설치합시다. install.packages("randomForest") install.packages("caret") randomForest 패키지에는 의사결정나무 함수가 들어있습니다. caret 패키지에는 예시에 사용할 데이터가 들어 있습니다. 패키지를 불러옵시다. library(caret) library(randomForest) 데이터를 불러오고 변수에 저장해줍니다. data(GermanCredit) data=GermanCredit 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 데이터가 굉장히 방대하기 때문에 일부만 추려서 살펴보겠습니다. > data[1:5,7:10] NumberPeopleMaintenance Telephone ForeignWorker Class .. 2022. 11. 23.
[R 감성분석]1.감성분석의 종류 감성분석은 어떤 텍스트가 긍정적인지 부정적인지 그 정도를 정량화하는 방법입니다. 감성분석은 크게 두가지로 나뉩니다. - 단어 사전 기반 분석 - 지도 기계학습 기반 분석 단어 사전 기반 분석 말그대로 단어 사전을 기반으로 분석하는 것입니다. 단어 사전은 단어의 감정과 강도가 입력되어 있는 자료입니다. 텍스트를 단어 사전과 비교하며 분석을 진행합니다. 지도 기계학습 기반 분석 감성지수가 사전 정의된 텍스트들을 학습데이터로 사용합니다. 2021. 7. 10.
[R 머신러닝] "K-최근접 이웃" #1. 개념 [R 머신러닝] "K-최근접 이웃" #1. 개념 목차는 아래와 같습니다. 1. 개념2. 알고리즘3. R 함수 설명4. R 코딩 예제 K최근접 이웃은 분류나 회귀에서 사용되는 머신러닝 방법입니다. 분류가 더 이해하기 쉽기 때문에 먼저 분류에 사용되는 경우부터 설명드리겠습니다. 분류는 데이터가 어떤 종류인지를 결정하는 것입니다. 예를들면 A라는 과일이 오렌지인지 사과인지를 분류하는 것입니다. k최근접이웃은 이름에서 알 수 있듯, 가장 가까이 있는 이웃의 데이터 종류가 분류 기준이 됩니다. A라는 과일이 오렌지와 가까이 있으면 오렌지가되고 사과와 가까이 있으면 사과가 됩니다. 가까이 있다는 것이 무엇일까요? 가깝고 멀고에서는 어떤 변수가 기준이 됩니다. 무게 일수도 있고 부피일 수도 있고 색일 수도 있습니다... 2020. 9. 25.
[R 머신러닝] "K-means 군집분석" #3. iris 예제 (1) 데이터 살펴보기 "K-means 군집분석" #3. iris 예제 (1) 데이터 살펴보기 R 내장데이터셋인 iris 데이터를 이용할 것입니다. head 함수와 str함수를 이용하여 데이터를 살펴봅시다. > head(iris,5) Sepal.Length Sepal.Width Petal.Length Petal.Width Species1 5.1 3.5 1.4 0.2 setosa2 4.9 3.0 1.4 0.2 setosa3 4.7 3.2 1.3 0.2 setosa4 4.6 3.1 1.5 0.2 setosa5 5.0 3.6 1.4 0.2 setosa > str(iris)'data.frame':150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.. 2019. 12. 19.
[R 딥러닝 예제] 표준정규분포함수 만들기 #3. 학습결과 평가하기 #3. 학습결과 평가하기 우리가 예측한 결과가 잘 맞는다는 것을 어떻게 확인할 수 있을까요. 먼저 실제 output과, 계산된 output 데이터를 가져옵시다. 지난시간까지 만든 코드를 실행하면 됩니다. 코드는 아래와 같습니다. library(neuralnet) #data 생성set.seed(1)input=rnorm(1000)output=dnorm(input) #train 데이터를 배정합니다.input_train=input[1:500]output_train=output[1:500] #test데이터를 배정합니다.input_test=input[501:1000]output_test=output[501:1000] #train 데이터 input,output을 하나의 행렬로 묶기my_data_train=cbind(.. 2019. 12. 14.