Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
Tags
- ppt
- 시뮬링크
- reference manager
- Python
- 파이썬
- 열역학
- 머신러닝
- J-1비자
- 매트랩
- 멘델레이
- 기계공학
- matplotlib
- 클러스터링
- 비지도학습
- matlab
- 포스코
- Fusion 360
- 파워포인트
- mendeley
- J1비자
- 군집화
- 포스코인턴
- 스틸브릿지
- git
- PEMFC
- simulink
- 연료전지
- 미국비자
- github
- CAD
Archives
- Today
- Total
목록Machine Learning/Reinforcement Learning (1)
신군의 역학사전

강화학습(Reinforcement Learning, RL)이란?강화학습(Reinforcement Learning, RL)은 에이전트(Agent)가 환경(Environment)과 상호작용하며, 현재의 상태(State)에서 어떤 행동(Action)을 취하는 것이 최적인지를 학습하는 기계 학습 방법이다. 시행착오(Trial & Error)를 통해 보상(Reward)을 최대화하는 방향으로 학습이 진행된다. 강화학습은 마치 자전거 타는법을 처음 배울 때와 유사한 방식인데, 처음에는 균형을 잡지 못하고 넘어지기도 하지만, 몸을 이리저리 움직여보며 균형잡는 방법을 학습하여 점점 더 오래 자전거를 탈 수 있게된다. 보상은 넘어지지 않고 트랙을 완주했을때, 부모가 아이에게 간식을 준다던지, 칭찬을 해준다던지.. 등으로 ..
Machine Learning/Reinforcement Learning
2025. 2. 24. 12:00