일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- CAD
- 파워포인트
- matlab
- matplotlib
- 스틸브릿지
- 파이썬
- 시뮬링크
- 기계공학
- 모깎이
- 매트랩
- simulink
- mendeley
- 포스코인턴
- 멘델레이
- 윈도우
- 비지도학습
- 연료전지
- 열역학
- PEMFC
- 클러스터링
- Python
- ppt
- 포스코
- reference manager
- 군집화
- Fusion 360
- 머신러닝
- git
- github
- Desktop
- Today
- Total
목록군집화 (3)
신군의 역학사전

1. DBSCAN 개요DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 데이터가 밀집되어 있는 영역을 클러스터로 보고, 희소 영역(밀도가 낮은 부분)을 노이즈로 간주하는 밀도 기반 군집화 알고리즘이다. DBSCAN은 임의의 형태의 클러스터를 찾을 수 있고, 노이즈를 제거하거나 탐지하는 용도로 활용이 가능하여 다른 클러스터링 기법에 비해 우수한 면이 있다. 2. TheoremDBSCAN 알고리즘의 구현을 위해 정리해야할 몇가지 이론(혹은 정의)이 있는데, 정리하면 다음과 같다.2-1. ε-neighborhood어떤 점 p를 기준으로, 데이터셋 D 안에 있는 점들 중, 거리(dist)가 ε 이하인 점들의 집합을 ε-이웃(ε-neighb..

1. 계층적 군집화(Hierarchical Clustering)계층적 군집화(Hierarchical Clustering)는 데이터 간의 유사성을 기반으로, 각 데이터가 개별 군집에서 시작하여 반복적인 병합 또는 분할 과정을 통해 계층적인 트리 구조(Dendrogram)를 형성하는 비지도학습 기법이다. K-means Clustering과는 달리 클러스터의 수를 사용자가 미리 지정해주지 않아도 된다는 장점이 있으며, 트리 구조를 통해 의미있는 분류 체계를 도출할 수 있다(트리구조의 높이로 taxonomy를 찾아낼 수도 있다). 최종적으로 생성된 덴드로그램을 바탕으로 사용자가 적절한 Cutting Point를 정해 클러스터 수를 나누게 된다. 아래의 그림을 예로들면, 수직선을 어디에 긋냐에 따라 최종 클러스터..

1. K-평균 군집화(K-means Clustering)란?K-means Clustering은 분할 군집화(Partitional Clustering) 알고리즘 중 하나로, 미리 지정된 K개의 클러스터로 데이터를 나누어 각 클러스터 내에서 데이터가 최대한 서로 가깝게 되도록 하는 것을 목표로 한다. 이를 통해, 정답 레이블링이 없는 상황에서 유사한 데이터셋을 하나의 Subset으로 효과적으로 묶어낼 수 있다. 다만, 클러스터의 수(K)는 사용자가 지정해주어야 하는 하이퍼파라미터로 사용자 판단하에 최적값을 모델에 집어넣어주어야 한다. 보통 최적 클러스터 수는 엘보우 방법(Elbow Method)에 따라 선택하며, 관련 내용은 아래의 게시글과 같다.https://ymechanics.tistory.com/ent..