-
Text mining 에 필요한 함수 정리R 끄적끄적/R 함수 Dictionary 2020. 4. 3. 10:19
* ctrl + f 로 찾아서 보면 편합니다.
[base]grep() : 패턴대로 골라주는 함수 ex)grep("[a-z]", letters)
[base]gsub() : 패턴대로 치환해주는 함수 ex)gsub("(\\w)(\\w*)", "\\U\\1\\L\\2", txt, perl=TRUE)
[stringr]str_replace() : 패턴대로 한번 치환해주는 함수
[stringr]str_replace_all() : 패턴대로 단어를 치환해주는 함수 ex) str_replace_all(txt, "\\W"," ")
[KoNLP]extractNoun() : 명사추출해서 리스트형식으로 반환
[base]class() : 속성을 확인
[base]dim() : 차원을 확인
[utils]View() : 미리보기
[base]unlist() : list형식에서
[base]table() : 요소들의 갯수를 카운트해서 테이블 형식으로 보여주는 함수
[base]readLines() : 줄 단위로 읽어주는 함수 ex)txt <- readLines("./hiphop.txt")
[base]nchar():글자의 갯수 반환
[dplyr]filter() : 조건을 걸러내는 함수 ex)filter(df_word, nchar(word)>=2)
[dplyr]arrange() : 정렬하는 함수 ex)arrange(desc(freq))
[dplyr]desc() : 역순으로
[base]summary() : 길이, 타입, 최소값 최대값등을 보여주는 함수
[dplyr]rename():데이터 프레임의 변수명을 바꾸어주는 함수 ex) rename(df_word, word=Var1,freq=Freq)
[RColorBrewer]vrewer.pal() : 색상 목록에서 색상 추출 ex)pal <- brewer.pal(8,"Dark2")
[base]set.sead() : 난수 고정
[wordcloud]wordcloud() : 워드 클라우드 생성
wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,
random.order=TRUE, random.color=FALSE, rot.per=.1,
colors="black",ordered.colors=FALSE,use.r.layout=FALSE,
fixed.asp=TRUE, ...)[utils]read.csv : csv파일 읽기 ex) twitter <- read.csv("./twitter.csv", header = T, stringsAsFactors=F, fileEncoding = "UTF-8")
[ggplot]ggplot() : 그래프 그리는 함수
[ggplot]ylim() : y값의 범위 설정
[ggplot]geom_col() : 막대 그래프만들기
[ggplot]coord_flip() : x y 축 바꿈
[ggplot]scale_x_discrete() : 빈도 순서 변수 기준 막대 정렬
[ggplot]geom_text() : 그래프에 글자 넣기 geom_text(hjust, vjust...)
[ggplot]aes() : 축 설정 aes(x , y, label ....)