군집연결방법1 [텍스트마이닝] Text Clustering 개념 및 활용 동아대 INSPIRE - python 텍스트마이닝 15강을 정리한 내용입니다. 1. Text Clustering 개념 Clustering이란, 개체들을 다양한 변수를 기준으로 다차원 공간에서 유사한 특성을 가진 개체로 묶는 방법으로서, 통계적으로는 개체들의 유사성(Similarity)과 상이성(Dissimilarity)에 근거하여 군집을 찾고 자료를 요약하는 탐색적인 자료 분석 방법이다. 2. 거리 계산 방법 ① 거리의 계산: 유사성/상이성의 기준 중고등학생 때 배웠던 유클리드의 거리를 활용해, 점과 점 사이의 거리를 계산하여 유사성 또는 상이성을 측정할 수 있다. 가까우면 유사성, 멀면 상이성이 될 것이다. 소득과 지출을 변수로 하는 세 사람이 있다. 20을 벌고 100을 쓰는 사람, 50을 벌고 20.. 2023. 1. 4. 이전 1 다음