일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 파이썬
- 군집화
- git
- 클러스터링
- 머신러닝
- matplotlib
- 매트랩
- mendeley
- CAD
- simulink
- 스틸브릿지
- ppt
- 기계공학
- Desktop
- Python
- matlab
- github
- 멘델레이
- PEMFC
- 모깎이
- reference manager
- 윈도우
- 파워포인트
- 연료전지
- 포스코
- 포스코인턴
- 비지도학습
- Fusion 360
- 열역학
- 시뮬링크
- Today
- Total
목록머신러닝 (5)
신군의 역학사전

1. DBSCAN 개요DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 데이터가 밀집되어 있는 영역을 클러스터로 보고, 희소 영역(밀도가 낮은 부분)을 노이즈로 간주하는 밀도 기반 군집화 알고리즘이다. DBSCAN은 임의의 형태의 클러스터를 찾을 수 있고, 노이즈를 제거하거나 탐지하는 용도로 활용이 가능하여 다른 클러스터링 기법에 비해 우수한 면이 있다. 2. TheoremDBSCAN 알고리즘의 구현을 위해 정리해야할 몇가지 이론(혹은 정의)이 있는데, 정리하면 다음과 같다.2-1. ε-neighborhood어떤 점 p를 기준으로, 데이터셋 D 안에 있는 점들 중, 거리(dist)가 ε 이하인 점들의 집합을 ε-이웃(ε-neighb..

1. 계층적 군집화(Hierarchical Clustering)계층적 군집화(Hierarchical Clustering)는 데이터 간의 유사성을 기반으로, 각 데이터가 개별 군집에서 시작하여 반복적인 병합 또는 분할 과정을 통해 계층적인 트리 구조(Dendrogram)를 형성하는 비지도학습 기법이다. K-means Clustering과는 달리 클러스터의 수를 사용자가 미리 지정해주지 않아도 된다는 장점이 있으며, 트리 구조를 통해 의미있는 분류 체계를 도출할 수 있다(트리구조의 높이로 taxonomy를 찾아낼 수도 있다). 최종적으로 생성된 덴드로그램을 바탕으로 사용자가 적절한 Cutting Point를 정해 클러스터 수를 나누게 된다. 아래의 그림을 예로들면, 수직선을 어디에 긋냐에 따라 최종 클러스터..

1. K-평균 군집화(K-means Clustering)란?K-means Clustering은 분할 군집화(Partitional Clustering) 알고리즘 중 하나로, 미리 지정된 K개의 클러스터로 데이터를 나누어 각 클러스터 내에서 데이터가 최대한 서로 가깝게 되도록 하는 것을 목표로 한다. 이를 통해, 정답 레이블링이 없는 상황에서 유사한 데이터셋을 하나의 Subset으로 효과적으로 묶어낼 수 있다. 다만, 클러스터의 수(K)는 사용자가 지정해주어야 하는 하이퍼파라미터로 사용자 판단하에 최적값을 모델에 집어넣어주어야 한다. 보통 최적 클러스터 수는 엘보우 방법(Elbow Method)에 따라 선택하며, 관련 내용은 아래의 게시글과 같다.https://ymechanics.tistory.com/ent..

클러스터링 개요 (Overview of Clustering)1. 클러스터링(Clustering)이란?군집 분석(Clsutering)은 주어진 데이터셋에서 유사한 특성을 가진 데이터 포인트들을 그룹으로 묶는 비지도학습(Unsupervised Learning)기법 중 하나로, 각 데이터의 유사성을 측정하여 다수의 군집으로 나누고 군집 간의 상이성을 확인한다. 이를 통해 데이터의 내재된 구조를 파악하고 숨겨진 패턴을 확인할 수 있으며, 가장 대표적인 기법으로 K-means Clustering, DBSCAN 등이 있다. 2. 클러스터링 프로세스(Standard Clustering Procedure)대표적인 클러스터링의 프로세스를 정리해보면 위의 그림과 같다. 특징 선택(Feature Selection)을 통해 ..

1. 기계학습(Machine Learning) 이란?머신러닝 텍스트북으로 가장 유명한 Tom M. Mitchell "Machine Learning" 에 따르면, 머신러닝은 특정 작업(T)에 대해 성능(P)를 향상시키기 위해 경험(E)에서 컴퓨터가 스스로 학습하는 과정을 말합니다. "A computer program is said to learn form experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E" [Ref 1] 기계"학습"의 과정에서 말하는 학습 시스템은 환경(E)으로..