ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 머신 러닝(Machine learning)의 접근법
    카테고리 없음 2023. 4. 25. 17:25

    머신 러닝(Machine learning)의 접근법

    머신러닝 접근법은 기존에 학습 시스템에서 사용할 수 있는 '신호' 또는 '피드백'의 성질에 따라 학습 패러다임에 대응하는 세 가지 큰 범주로 나누어져 있습니다.

     

     

    ⊙감독 학습: 컴퓨터에는 '교사'가 주어진 입력 예와 필요한 출력 예가 표시됩니다.목적은 입력을 출력에 매핑하는 일반적인 규칙을 학습하는 것입니다.

    ⊙비지도 학습 : 학습 알고리즘에는 라벨이 붙지 않고 입력에서 구조를 찾기 위해 독자적으로 남겨두었습니다. 감독되지 않은 학습은 그 자체가 목표(데이터 내 숨겨진 패턴의 발견)이거나 목적을 향한 수단(기능 학습)일 가능성이 있습니다.

    ⊙강화 학습: 컴퓨터 프로그램은 특정 목표(차량 운전이나 상대와의 게임 등)를 실행해야 하는 동적인 환경과 상호 작용합니다. 문제의 영역을 탐색하면 프로그램은 보상과 유사한 피드백을 제공하고 극대화하려고 합니다.

    감독학습

    지원 벡터 머신은 데이터를 선형 경계로 구분된 영역으로 분할하는 감시 학습 모델입니다. 여기서 선형 경계는 검은색 원과 흰색 원을 분할합니다. 감시된 학습 알고리즘은 입력과 원하는 출력을 모두 포함하는 일련의 데이터의 수학적 모델을 구축합니다. 이 데이터는 트레이닝 데이터로 알려져 있으며 훈련 예제 세트로 구성되어 있습니다.

     

    각 훈련 예에는 하나 이상의 입력과 슈퍼바이저 신호라고도 불리는 원하는 출력이 있습니다. 수학 모델에서 각 훈련 예는 배열 또는 벡터로 표시되며 때로는 특징 벡터라고 불리며 훈련 데이터는 행렬로 표시됩니다. 감시된 학습 알고리즘은 목적 함수의 반복 최적화를 통해 새로운 입력과 관련된 출력을 예측하는 데 사용할 수 있는 함수를 학습합니다.

     

    최적의 함수를 사용하면 알고리즘이 훈련 데이터의 일부가 아닌 입력의 출력을 올바르게 결정할 수 있습니다. 시간이 지남에 따라 출력 또는 예측의 정확도를 향상시키는 알고리즘은 그 작업을 수행하는 것을 학습했다고 알려져 있습니다.

     

    모니터링된 학습 알고리즘 유형에는 활성 학습, 분류 및 회귀가 포함됩니다. 분류 알고리즘은 출력이 제한된 값 세트로 제한되어 있을 때 사용되며 회귀 알고리즘은 출력이 범위 내의 수치를 가질 때 사용됩니다. 예를 들어, 이메일을 필터링하는 분류 알고리즘의 경우 입력은 착신 전자 메일이 되고 출력은 전자 메일을 파일링하는 폴더의 이름이 됩니다.

     

    유사성 학습은 회귀·분류와 밀접하게 관련된 감독 기계학습 분야인데, 유사성 함수를 이용하여 두 물체가 얼마나 유사한지 측정하는 사례를 통해 학습하는 것이 목표입니다. 랭킹, 추천 시스템, 시각적 정체성 추적, 얼굴 인증, 스피커 인증 등의 애플리케이션이 있습니다.

    비지도 학습

    비감시 학습 알고리즘은 입력만을 포함한 일련의 데이터를 가져와 데이터 포인트 그룹화 및 클러스터화와 같은 데이터 내 구조를 찾습니다. 따라서 알고리즘은 레이블 지정, 분류 또는 분류되지 않은 테스트 데이터에서 학습합니다. 비감시 학습 알고리즘은 피드백에 응답하는 대신 데이터 내의 공통성을 식별하고 각 새로운 데이터 내의 그러한 공통성 여부를 기반으로 반응합니다. 비지도 학습의 중심 응용은 확률 밀도 함수의 발견 등 통계학에서 밀도 추정 분야에 있습니다. 감독되지 않은 학습은 데이터 기능의 요약과 설명을 포함한 다른 영역을 포함합니다.

     

    클러스터 분석은 같은 클러스터 내 관측치가 하나 이상의 사전 지정된 기준에 따라 유사한 반면, 다른 클러스터에서 추출된 관측치는 다르듯이 일련의 관측치를 하위 집합(클러스터라고 불립니다)에 할당하는 것입니다. 클러스터링 기법에 따라 데이터 구조에 대해 다른 가정이 이루어집니다.데이터 구조는 종종 어떤 유사성 메트릭에 의해 정의되며 내부의 컴팩트함이나 같은 클러스터 구성원 간의 유사성 및 클러스터 간의 차이로 평가됩니다. 그 외의 방법은 추정 밀도와 그래프 연결성을 기반으로 합니다.

    반지도 학습

    반지도 학습은 감독되지 않은 학습(라벨 부착 트레이닝 데이터 없음)과 지고 학습(라벨 부착 트레이닝 데이터 있음) 사이에 있습니다. 훈련 예제 중에는 트레이닝 라벨이 없는 것도 있지만, 많은 기계 학습 연구자들은 레이블이 지정되지 않은 데이터를 소량의 레이블이 지정된 데이터와 조합하여 사용하면 학습 정확도가 크게 향상된다는 것을 발견하고 있습니다.

    약한 감독 학습에서 훈련 라벨은 노이즈가 많고 제한적이거나 부정확합니다.그러나 이러한 라벨은 대부분의 경우 더 저렴하게 입수할 수 있기 때문에 효과적인 트레이닝 세트가 커집니다.

    강화학습

    강화 학습은 누적 보상 개념을 극대화하기 위해 소프트웨어 에이전트가 환경 내에서 어떻게 행동해야 하는지에 관한 기계 학습 분야입니다. 그 일반성 때문에 이 분야는 게임 이론, 제어 이론, 조작 연구, 정보 이론, 시뮬레이션 기반 최적화, 멀티 에이전트 시스템, 군 지능, 통계 및 유전 알고리즘 등 다른 많은 분야에서 연구되고 있습니다.

     

    기계 학습에서 환경은 일반적으로 마르코프 결정 프로세스(MDP)로 표시됩니다. 많은 강화 학습 알고리즘은 동적 프로그래밍 기술을 사용합니다.강화학습 알고리즘은 MDP의 정확한 수학모델 지식을 전제로 하지 않으며 정확한 모델이 불가능할 때 사용됩니다. 강화 학습 알고리즘은 자율주행차나 인간 상대와 게임을 하기 위한 학습에 사용됩니다.

    차원 축소

    차원 축소는 일련의 주요 변수를 취득함으로써 검토 중인 랜덤 변수의 수를 줄이는 프로세스입니다. 즉, 피쳐 세트의 크기를 축소하는 프로세스이며, '피쳐의 수'라고도 불립니다. 대부분의 치수 절감 기법은 기능 제거 또는 추출로 간주할 수 있습니다. 치수 감소의 일반적인 방법 중 하나는 주성분 분석(PCA)입니다.

     

    PCA에는 고차원 데이터(3D 등)를 작은 공간(2D 등)으로 변경해야 합니다. 이로 인해 데이터를 변경하지 않고 모델 내의 모든 원래 변수를 유지하면서 데이터의 차원이 작아집니다(3D가 아닌 2D). 매니폴드 가설은 고차원 데이터 세트가 저차원 매니폴드를 따라 있음을 제안하며, 많은 차원 축소 기술이 이러한 가정을 만들어 매니폴드 학습과 매니폴드 정규화 영역으로 이어집니다.

    댓글

Designed by Tistory.