본문 바로가기

전체 글11

R 딥러닝 예시 (iris 데이터) 데이터를 변수에 저장해줍니다. iris라는 내장데이터를 이용할 것입니다. data=iris 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 str함수를 이용하여 변수들을 살펴봅시다. > str(data) 'data.frame':150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 .. 2023. 7. 28.
R 서포트 벡터 머신 예시 (대장암 예시) 먼저 아래 패키지를 설치합시다. install.packages("survival") survival 패키지에는 대장암 데이터인 colon 데이터가 들어 있습니다. 패키지를 불러옵니다. library(survival) 데이터를 변수에 저장해줍니다. data=colon 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 str함수를 이용하여 변수들을 살펴봅시다. > str(colon) 'data.frame':1858 obs. of 16 variables: $ id : num 1 1 2 2 3 3 4 4 5 5 ... $ study : num 1 1 1 1 1 1 1 1 1 1 ... $ rx : Factor w/ 3 levels "Obs","Lev","Lev+5FU": 3 3 3 3 1 1 3 3.. 2023. 7. 27.
R 로지스틱 회귀분석 예시 (대장암 예시) 먼저 아래 패키지를 설치합시다. install.packages("survival") survival 패키지에는 대장암 데이터인 colon 데이터가 들어 있습니다. 패키지를 불러옵니다. library(survival) 데이터를 변수에 저장해줍니다. data=colon 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 str함수를 이용하여 변수들을 살펴봅시다. > str(colon) 'data.frame':1858 obs. of 16 variables: $ id : num 1 1 2 2 3 3 4 4 5 5 ... $ study : num 1 1 1 1 1 1 1 1 1 1 ... $ rx : Factor w/ 3 levels "Obs","Lev","Lev+5FU": 3 3 3 3 1 1 3 3.. 2022. 11. 23.
R 랜덤포레스트 예시 (신용등급예시) 먼저 아래 패키지를 설치합시다. install.packages("randomForest") install.packages("caret") randomForest 패키지에는 의사결정나무 함수가 들어있습니다. caret 패키지에는 예시에 사용할 데이터가 들어 있습니다. 패키지를 불러옵시다. library(caret) library(randomForest) 데이터를 불러오고 변수에 저장해줍니다. data(GermanCredit) data=GermanCredit 이후 과정은 번호를 붙여 진행하겠습니다. 1. 데이터 살펴보기 데이터가 굉장히 방대하기 때문에 일부만 추려서 살펴보겠습니다. > data[1:5,7:10] NumberPeopleMaintenance Telephone ForeignWorker Class .. 2022. 11. 23.
[R 감성분석]1.감성분석의 종류 감성분석은 어떤 텍스트가 긍정적인지 부정적인지 그 정도를 정량화하는 방법입니다. 감성분석은 크게 두가지로 나뉩니다. - 단어 사전 기반 분석 - 지도 기계학습 기반 분석 단어 사전 기반 분석 말그대로 단어 사전을 기반으로 분석하는 것입니다. 단어 사전은 단어의 감정과 강도가 입력되어 있는 자료입니다. 텍스트를 단어 사전과 비교하며 분석을 진행합니다. 지도 기계학습 기반 분석 감성지수가 사전 정의된 텍스트들을 학습데이터로 사용합니다. 2021. 7. 10.
[R크롤링] 자바스크립트 홈페이지 크롤링(R셀레니움) 1. C드라이브에 폴더생성 C드라이브에 R_Seleniom 이라는 폴더 생성 2. 파일 다운로드 아래 세 파일을 다운로드함. 1) 셀레니움 다운로드 www.seleniumhq.org/download/ 2) geckodriver 다운로드 github.com/mozilla/geckodriver/releases/tag/v0.17.0 3) 크롬 드라이버 다움로드 sites.google.com/a/chromium.org/chromedriver/downloads 크롬드라이버는 본인 드라이버 버전과 일치하도록 다운로드함. [도움말]-[크롬정보]에서 버전확인. 앞에 두자리가 버전임. 3. 커맨드 창에 코드실행 커맨드 창을 열고 아래 코드를 실행함. 3.141.59는 다운받은 셀레늄 서버 파일명에서 가져올 것. cd C.. 2021. 4. 7.
[R 머신러닝] "K-최근접 이웃" #1. 개념 [R 머신러닝] "K-최근접 이웃" #1. 개념 목차는 아래와 같습니다. 1. 개념2. 알고리즘3. R 함수 설명4. R 코딩 예제 K최근접 이웃은 분류나 회귀에서 사용되는 머신러닝 방법입니다. 분류가 더 이해하기 쉽기 때문에 먼저 분류에 사용되는 경우부터 설명드리겠습니다. 분류는 데이터가 어떤 종류인지를 결정하는 것입니다. 예를들면 A라는 과일이 오렌지인지 사과인지를 분류하는 것입니다. k최근접이웃은 이름에서 알 수 있듯, 가장 가까이 있는 이웃의 데이터 종류가 분류 기준이 됩니다. A라는 과일이 오렌지와 가까이 있으면 오렌지가되고 사과와 가까이 있으면 사과가 됩니다. 가까이 있다는 것이 무엇일까요? 가깝고 멀고에서는 어떤 변수가 기준이 됩니다. 무게 일수도 있고 부피일 수도 있고 색일 수도 있습니다... 2020. 9. 25.
[R 머신러닝] "K-means 군집분석" #3. iris 예제 (1) 데이터 살펴보기 "K-means 군집분석" #3. iris 예제 (1) 데이터 살펴보기 R 내장데이터셋인 iris 데이터를 이용할 것입니다. head 함수와 str함수를 이용하여 데이터를 살펴봅시다. > head(iris,5) Sepal.Length Sepal.Width Petal.Length Petal.Width Species1 5.1 3.5 1.4 0.2 setosa2 4.9 3.0 1.4 0.2 setosa3 4.7 3.2 1.3 0.2 setosa4 4.6 3.1 1.5 0.2 setosa5 5.0 3.6 1.4 0.2 setosa > str(iris)'data.frame':150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.. 2019. 12. 19.
[R 딥러닝 예제] 표준정규분포함수 만들기 #3. 학습결과 평가하기 #3. 학습결과 평가하기 우리가 예측한 결과가 잘 맞는다는 것을 어떻게 확인할 수 있을까요. 먼저 실제 output과, 계산된 output 데이터를 가져옵시다. 지난시간까지 만든 코드를 실행하면 됩니다. 코드는 아래와 같습니다. library(neuralnet) #data 생성set.seed(1)input=rnorm(1000)output=dnorm(input) #train 데이터를 배정합니다.input_train=input[1:500]output_train=output[1:500] #test데이터를 배정합니다.input_test=input[501:1000]output_test=output[501:1000] #train 데이터 input,output을 하나의 행렬로 묶기my_data_train=cbind(.. 2019. 12. 14.
[R 딥러닝 예제] 표준정규분포함수 만들기 #2. 학습결과 확인하기 #2. 학습결과 확인하기 우리는 지난시간에 아래와 같은 train 데이터와 test 데이터를 정의했습니다. library(neuralnet) #data 생성set.seed(1)input=rnorm(1000)output=dnorm(input) #train 데이터를 배정합니다.input_train=input[1:500]output_train=output[1:500] #test데이터를 배정합니다.input_test=input[501:1000]output_test=output[501:1000] #train 데이터 input,output을 하나의 행렬로 묶기my_data_train=cbind(input_train,output_train) input_train과 output_train 데이터를 이용하여 신경망을 학.. 2019. 12. 14.
[R 딥러닝 예제] 표준정규분포함수 만들기 #1. neuralnet 패키지로 신경망 만들기 #1. neuralnet 패키지로 신경망 만들기 딥러닝을 이용하여 표준정규분포함수를 학습시켜보려고 합니다. 먼저 패키지를 설치해야하는데요. neuralnet 패키지를 사용할겁니다. 아래와 같이 패키지를 설치합니다. install.packages("neuralnet") neuralnet 라이브러리를 호출하고 데이터를 생성합니다. library(neuralnet) #data 생성 set.seed(1) input=rnorm(1000) output=dnorm(input) rnorm함수는 정규분포의 확률변수를 임의로 추출해주는 함수입니다. 확률분포값을 이용하여 변수를 추출하므로, 확률분포 값이 클 수록 추출될 확률이 높습니다. 디폴트 값이 평균 0, 표준편차 1 이므로, 표준정규분포에서 확률변수가 추출됩니다. 확.. 2019. 12. 13.