한글군집분석1 [텍스트마이닝] 한글 Document cluster 동아대 INSPIRE - python텍스트마이닝 29강을 실습 및 정리한 내용입니다. 이번 글에서는 한글 문서 간 군집 분석을 실습해 보겠습니다. 1. 패키지/데이터 불러오기, TFIDF기준 DTM 만들기 먼저 필요한 패키지들을 불러옵니다. 여기서 KMeans는 반복을 통한 군집분석을, dendrogram은 그림으로 시각화하는 패키지입니다. 분석의 결과와 그림의 결과가 다르게 나올 수 있는데 잘못된 것은 아니라는 점을 알고 있으면 됩니다. import numpy as np import pickle from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.cluster import KMeans from scipy.cluster.hie.. 2023. 2. 16. 이전 1 다음