-
머신러닝(Machine learning)의 개요 및 역사카테고리 없음 2023. 4. 23. 21:54
머신러닝(Machine learning)
머신러닝(ML)은 머신이 '학습'할 수 있도록 하는 방법, 즉 데이터를 활용해 일부 태스크에서 컴퓨터 성능을 향상시키는 방법을 이해하고 구축하는 데 특화된 분야입니다. 그것은 인공지능의 넓은 하위 분야로 간주됩니다.
머신러닝 알고리즘은 명시적으로 프로그램되지 않고 예측이나 결정을 내리기 위해 트레이닝 데이터라고 불리는 샘플 데이터를 기반으로 모델을 구축합니다. 머신러닝 알고리즘은 의학, 이메일 필터링, 음성 인식, 농업, 컴퓨터 비전 등 필요한 작업을 수행하기 위한 기존 알고리즘 개발이 어렵거나 불가능한 다양한 애플리케이션에서 사용됩니다.
머신러닝의 하위 집합은 계산 통계와 밀접하게 관련되어 있으며, 계산 통계는 컴퓨터를 사용하여 예측을 수행하는 데 초점을 맞추고 있지만 모든 머신러닝이 통계 학습은 아닙니다. 수학적 최적화 연구는 방법, 이론 및 응용 프로그램 도메인을 기계 학습 분야에 제공합니다. 데이터 마이닝은 감독되지 않은 학습을 통한 탐색적 데이터 분석에 초점을 맞춘 관련 연구 분야입니다.
기계 학습의 몇 가지 구현은 생물학적인 뇌의 작용을 모방하는 방법으로 데이터와 신경망을 사용합니다.
비즈니스상의 문제에 걸친 애플리케이션에서는 기계 학습을 예측 분석이라고도 합니다.
개요
학습 알고리즘은 과거에 잘 기능했던 전략, 알고리즘, 추론이 앞으로도 잘 작동할 가능성이 높다는 점을 바탕으로 작동합니다. 이러한 추론은 '지난 1만일 동안은 매일 아침 태양이 떴기 때문에 아마 내일 아침도 뜰 것이다.'와 같이 때때로 밝혀질 수 있습니다. 다른 경우에는 '가족의 X%가 색 변이를 가진 지리적으로 분리된 종을 가지고 있기 때문에 미발견 검은 백조가 존재할 가능성이 Y%'처럼 더 뉘앙스를 가질 수 있습니다.
기계 학습 프로그램은 명시적으로 프로그램되지 않고 작업을 수행할 수 있습니다. 컴퓨터가 특정 작업을 수행하기 위해 제공된 데이터에서 학습하는 것을 포함합니다. 컴퓨터에 할당된 간단한 작업에서는 문제를 해결하기 위해 필요한 모든 절차를 수행하는 방법을 기계에 지시하는 알고리즘을 프로그래밍할 수 있습니다.컴퓨터 측에서는 학습이 필요하지 않습니다. 보다 고도의 작업에서는 필요한 알고리즘을 인간이 수동으로 작성하는 것은 어렵습니다. 실제로는 인간 프로그래머에게 필요한 모든 단계를 지정시키는 것보다 기계가 독자적인 알고리즘을 개발하는 것을 돕는 것이 효과적인 것으로 판명될 가능성이 있습니다.
기계 학습 규율은 완전히 만족스러운 알고리즘이 이용할 수 없는 작업을 컴퓨터에 실행하도록 가르치기 위해 다양한 접근 방식을 채택하고 있습니다. 방대한 수의 잠재적인 답변이 존재하는 경우, 한 가지 접근법은 몇 가지 올바른 답변에 유효한 라벨을 붙이는 것입니다. 이것은 컴퓨터가 올바른 답을 판단하기 위해 사용하는 알고리즘을 개선하기 위한 교육 데이터로 사용할 수 있습니다. 예를 들어, 디지털 문자 인식 작업을 위한 시스템을 교육하기 위해 손으로 쓴 숫자의 MNIST 데이터 세트가 자주 사용되고 있습니다.
역사
머신러닝이라는 용어는 IBM 직원이자 컴퓨터 게임과 인공지능 분야의 선구자인 아서 사무엘에 의해 1959년에 만들어졌습니다. 동의어 자기학습 컴퓨터도 이 시기에 사용되었습니다.
1960년대 초까지 사이버 트론이라고 불리는 펀치 테이프 메모리를 갖춘 실험적인 '학습 머신'이 레이시온사에 의해 개발되어 기초적인 강화 학습을 사용하여 소나 신호, 심전도 및 음성 패턴을 분석했습니다. 패턴을 인식하기 위해 인간 오퍼레이터/교사에 의해 반복적으로 '훈련'되었고, 잘못된 결정을 재평가시키기 위해 '구프' 버튼이 장착되었습니다.1960년대 기계학습 연구에 관한 대표적인 책은 주로 패턴 분류를 위한 기계학습을 다룬 닐슨의 Learning Machines 책이었습니다.
패턴 인식에 관한 관심은 1973년 듀다와 하트에 의해 기술된 것처럼 1970년대까지 계속되었습니다.1981년에 신경망이 컴퓨터 단말기에서 40자(26문자, 10자리, 4개의 특수 기호)를 인식하는 방법을 학습하기 위한 교육 전략 사용에 관한 보고서가 발표되었습니다.
Tom M. Mitchell은 기계 학습 분야에서 연구된 알고리즘에 대해 널리 인용되어 보다 형식적인 정의를 제공했습니다.컴퓨터 프로그램은 여러 클래스의 태스크 T와 퍼포먼스 측정 P에 관해 경험 E로부터 배운다고 합니다.P에 의해 측정된 작업의 성능이 경험 E와 함께 향상되면 P를 측정합니다. "이 정의는 기계 학습과 관련된 작업은 인지적인 용어로 필드를 정의하는 것이 아니라 기본적으로 운영상 정의를 제공합니다.
이는 앨런 튜링의 논문 'Computing Machinery and Intelligence' 중 'Can machines think?'라는 질문이 'Can machines do whatwe (사고 엔티티로서) can do whatwe (사고 엔티티로서) can?'이라는 질문으로 대체된 것입니다.
현대의 기계 학습에는 두 가지 목적이 있습니다.하나는 개발된 모델을 기반으로 데이터를 분류하는 것, 다른 하나는 이러한 모델을 기반으로 미래의 결과를 예측하는 것입니다. 데이터 분류에 특화된 가상 알고리즘은 암성 몰을 분류하기 위해 훈련하기 위해 두더지의 컴퓨터 비전과 감독 학습을 사용할 수 있습니다. 주식 거래를 위한 기계 학습 알고리즘은 미래의 잠재적인 예측을 트레이더에게 통지할 가능성이 있습니다.