코딩한걸음
728x90
반응형

https://towardsdatascience.com/the-future-with-reinforcement-learning-877a17187d54

지도 학습 (Supervised learning)

https://www.researchgate.net/figure/Supervised-learning-and-unsupervised-learning-Supervised-learning-uses-annotation_fig1_329533120

  • 정답을 알려주면서 학습시키는 방법

  • 입력값과 출력값이 필요하다.

  • 입력값은 있지만 출력값이 없는 경우 많아 라벨링(Labeling, 레이블링), 어노테이션(Annotation) 작업을 해서 출력값을 하나하나 입력해준다.

비지도 학습 (Unsupervised learning)

https://www.researchgate.net/figure/Supervised-learning-and-unsupervised-learning-Supervised-learning-uses-annotation_fig1_329533120

  • 정답을 알려주지 않고 군집화(Clustering)하는 방법

  • 입력값만 존재해도 학습 가능

  • 비지도 학습의 종류
    • 군집 (Clustering)
      • K-평균 (K-Means)
      • 계측 군집 분석(HCA, Hierarchical Cluster Analysis)
      • 기댓값 최대화 (Expectation Maximization)

    • 시각화(Visualization)와 차원 축소(Dimensionality Reduction)
      • 주성분 분석(PCA, Principal Component Analysis)
      • 커널 PCA(Kernel PCA)
      • 지역적 선형 임베딩(LLE, Locally-Linear Embedding)
      • t-SNE(t-distributed Stochastic Neighbor Embedding)
    • 연관 규칙 학습(Association Rule Learning)
      • 어프라이어리(Apriori)
      • 이클렛(Eclat)

강화 학습 (Reinforcement learning)

  • 강화학습의 개념
    • 에이전트(Agent)
    • 환경(Environment)
    • 상태(State)
    • 행동(Action)
    • 보상(Reward)

  • 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화 하는 행동 혹은 행동 순서를 선택하는 방법


Uploaded by N2T

728x90
반응형
profile

코딩한걸음

@Joonyeol_Yoon

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!