ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Text mining 에 필요한 함수 정리
    R 끄적끄적/R 함수 Dictionary 2020. 4. 3. 10:19

    * ctrl + f 로 찾아서 보면 편합니다.

     

    [base]grep() : 패턴대로 골라주는 함수 ex)grep("[a-z]", letters)

    [base]gsub() : 패턴대로 치환해주는 함수 ex)gsub("(\\w)(\\w*)", "\\U\\1\\L\\2", txt, perl=TRUE)

    [stringr]str_replace() : 패턴대로 한번 치환해주는 함수

    [stringr]str_replace_all() : 패턴대로 단어를 치환해주는 함수 ex) str_replace_all(txt, "\\W"," ")

    [KoNLP]extractNoun() : 명사추출해서 리스트형식으로 반환

    [base]class() :  속성을 확인

    [base]dim() : 차원을 확인

    [utils]View() : 미리보기

    [base]unlist() : list형식에서

    [base]table() : 요소들의 갯수를 카운트해서 테이블 형식으로 보여주는 함수

    [base]readLines() : 줄 단위로 읽어주는 함수 ex)txt <- readLines("./hiphop.txt")

    [base]nchar():글자의 갯수 반환

    [dplyr]filter() : 조건을 걸러내는 함수 ex)filter(df_word, nchar(word)>=2)

    [dplyr]arrange() : 정렬하는 함수 ex)arrange(desc(freq))

    [dplyr]desc() : 역순으로

    [base]summary() : 길이, 타입, 최소값 최대값등을 보여주는 함수

    [dplyr]rename():데이터 프레임의 변수명을 바꾸어주는 함수 ex) rename(df_word, word=Var1,freq=Freq)

    [RColorBrewer]vrewer.pal() : 색상 목록에서 색상 추출  ex)pal <- brewer.pal(8,"Dark2")

    [base]set.sead() : 난수 고정

    [wordcloud]wordcloud() : 워드 클라우드 생성 

         wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,
                        random.order=TRUE, random.color=FALSE, rot.per=.1,
                        colors="black",ordered.colors=FALSE,use.r.layout=FALSE,
                        fixed.asp=TRUE, ...)

    [utils]read.csv : csv파일 읽기  ex) twitter <- read.csv("./twitter.csv", header = T, stringsAsFactors=F, fileEncoding =       "UTF-8")

    [ggplot]ggplot() : 그래프 그리는 함수

    [ggplot]ylim() : y값의 범위 설정
    [ggplot]geom_col() : 막대 그래프만들기
    [ggplot]coord_flip() : x y 축 바꿈
    [ggplot]scale_x_discrete() : 빈도 순서 변수 기준 막대 정렬
    [ggplot]geom_text() : 그래프에 글자 넣기 geom_text(hjust, vjust...)
    [ggplot]aes() : 축 설정 aes(x ,  y,  label ....)

     

    댓글

Designed by Tistory.