Машинне навчання (ML) - це наукове вивчення алгоритмів та статистичних моделей, які комп'ютерні системи використовують для виконання конкретного завдання без використання чітких інструкцій, покладаючись на закономірності та умовиводи. Це розглядається як підмножина штучного інтелекту. Алгоритми машинного навчання будують математичну модель на основі вибіркових даних, відомих як "дані тренінгу", для того, щоб приймати прогнози чи рішення, не будучи явно запрограмованими для виконання завдання.: 2 Алгоритми машинного навчання використовуються в широкому спектрі застосувань, наприклад як фільтрація електронної пошти та комп’ютерний зір, де складно або нездійсненно розробити звичайний алгоритм для ефективного виконання завдання.
Машинне навчання тісно пов'язане з обчислювальною статистикою, яка зосереджена на прогнозуванні за допомогою комп'ютерів. Вивчення математичної оптимізації доставляє методи, теорії та області застосування в область машинного навчання. Обмін даними - це сфера вивчення в рамках машинного навчання і фокусується на дослідницькому аналізі даних шляхом непідконтрольного навчання. У його застосуванні серед бізнес-проблем машинне навчання також називається прогностичною аналітикою.
Ім'я машинного навчання було введено в 1959 Артуром Самуелем. Том Мітчелл надав широко цитоване, більш формальне визначення алгоритмів, вивчених у галузі машинного навчання: "Кажуть, що комп'ютерна програма вивчає досвід Е щодо деякого класу завдань T і міра ефективності P, якщо її виконання на завданнях в Т, виміряний Р, покращується з досвідом Е. " Це визначення завдань, що стосуються машинного навчання, пропонує принципово оперативне визначення, а не визначення галузі в когнітивному розумінні. З цього випливає пропозиція Алана Тьюрінга в його праці "Обчислювальні машини та інтелект", в якій питання "Чи можуть машини думати?" замінюється питанням "Чи можуть машини робити те, що ми (як мислячі суб'єкти) можемо робити?". У пропозиції Тьюрінга розкриваються різні характеристики, якими може володіти мисляча машина, та різні наслідки в її побудові.
Завдання машинного навчання класифікуються на кілька широких категорій. При контрольованому навчанні алгоритм будує математичну модель із набору даних, що містить і вхідні дані, і бажані результати. Наприклад, якби завдання визначали, чи містить зображення певний об'єкт, дані навчання алгоритму керованого навчання включатимуть зображення з цим об'єктом та без нього (вхід), і кожне зображення матиме мітку (вихід), що позначає, чи в ній містився предмет. В особливих випадках вхід може бути лише частково доступним або обмежений спеціальним зворотним зв'язком. Напівконтрольовані алгоритми навчання розробляють математичні моделі з неповних даних про навчання, де частина вхідного зразка не має міток.
Алгоритми класифікації та алгоритми регресії є типами контрольованого навчання. Алгоритми класифікації використовуються, коли виходи обмежуються обмеженим набором значень. Для алгоритму класифікації, який фільтрує електронні листи, введенням буде вхідна електронна пошта, а вихідним буде ім'я папки, в яку потрібно подати електронну пошту. Для алгоритму, який ідентифікує спам-листи, результатом буде передбачення або "спаму", або "не спаму", представленого булевими значеннями true та false. Алгоритми регресії названі для їх постійних виходів, тобто вони можуть мати будь-яке значення в межах діапазону. Прикладами безперервного значення є температура, довжина або ціна предмета.
При непідконтрольному навчанні алгоритм будує математичну модель із набору даних, який містить лише входи та відсутні потрібні мітки виводу. Алгоритми навчання без нагляду використовуються для пошуку структури в даних, як групування або кластеризація точок даних. Навчання без нагляду може виявити закономірності в даних і може групувати вхідні дані за категоріями, як у навчанні за допомогою функцій. Зменшення розмірності - це процес зменшення кількості "функцій" або входів у наборі даних.
Активні алгоритми навчання отримують доступ до бажаних результатів (навчальних міток) для обмеженого набору входів на основі бюджету та оптимізують вибір вхідних даних, для яких він придбає навчальні мітки. При інтерактивному використанні вони можуть бути представлені користувачеві для маркування. Алгоритми навчання зміцнення отримують зворотний зв'язок у вигляді позитивного або негативного підкріплення в динамічному середовищі і використовуються в автономних транспортних засобах або в навчанні грати в гру проти суперника людини.: 3 Інші спеціалізовані алгоритми машинного навчання включають моделювання тем, де комп’ютерній програмі надається набір документів з природної мови та знаходить інші документи, що висвітлюють аналогічні теми. Алгоритми машинного навчання можуть бути використані для пошуку непомітної функції щільності ймовірності в задачах оцінки щільності. Алгоритми навчання мета вивчають власну індуктивну зміщення на основі попереднього досвіду. У робототехніці, що розвивається, алгоритми навчання роботів генерують власні послідовності досвіду навчання, також відомі як навчальний план, щоб кумулятивно здобувати нові навички шляхом самостійного вивчення та соціальної взаємодії з людьми. Ці роботи використовують механізми наведення, такі як активне навчання, дозрівання, рухові синергії та наслідування.
Артур Самуель, американський піонер у галузі комп’ютерних ігор та штучного інтелекту, ввів у 1959 термін "машинне навчання", перебуваючи в IBM. Репрезентативною книгою досліджень машинного навчання під час 1960 була книга Нілссона про навчальні машини, що стосувалася переважно машинного навчання для класифікації моделей. Інтерес до машинного навчання, пов’язаного з розпізнаванням образів, продовжувався під час 1970, як описано в книзі Дуди і Харта в 1973. У 1981 було подано звіт про використання стратегій навчання, щоб нейронна мережа вчилася розпізнавати символи 40 (букви 26, цифри 10 та спеціальні символи 4) з комп'ютерного терміналу. Як наукове починання, машинне навчання виросло з пошуків штучного інтелекту. Вже в перші дні ШІ як навчальної дисципліни деякі дослідники були зацікавлені в тому, щоб машини вивчили дані. Вони намагалися підійти до проблеми різними символічними методами, а також тим, що тоді називали "нейронними мережами"; це були здебільшого перцептрони та інші моделі, які згодом виявились переосмисленням узагальнених лінійних моделей статистики. Також були використані імовірнісні міркування, особливо в автоматизованій медичній діагностиці.: 488
Однак все більший акцент на логічному підході до знань спричинив розрив між ШІ та машинним навчанням. Імовірнісні системи зазнали теоретичних та практичних проблем збору даних та їх представлення.: 488 До 1980, експертні системи стали переважати над ШІ, і статистика вийшла з користі. Робота над символічним / заснованим на знаннях продовжувалась в рамках ШІ, що призводило до індуктивного логічного програмування, але більш статистична лінія досліджень тепер знаходилась поза сферою власного ІІ, в розпізнаванні шаблонів та пошуку інформації: 708–710; Дослідження нейромережевих мереж 755 були покинуті AI та інформатикою приблизно в той же час. Ця лінія також була продовжена поза полем AI / CS, як "коннекціонізм", дослідниками інших дисциплін, включаючи Хопфілда, Румелхарта та Хінтона. Їх головний успіх прийшов у середині 1980 з відновленням зворотного розповсюдження.: 25
Машинне навчання, реорганізоване як окреме поле, почало процвітати в 1990. Поле змінило свою мету від досягнення штучного інтелекту до вирішення вирішуваних проблем практичного характеру. Він змістив фокус від символічних підходів, успадкованих від ШІ, і до методів та моделей, запозичених із статистики та теорії ймовірностей. Він також отримав користь від збільшення доступності оцифрованої інформації та можливості її поширення через Інтернет.
Машинне навчання та обробка даних часто використовують одні й ті ж методи і перекриваються значною мірою, але в той час як машинне навчання фокусується на прогнозуванні, заснованому на відомих властивостях, отриманих на основі навчальних даних, обробка даних фокусується на виявленні (раніше) невідомих властивостей у даних (це крок аналізу відкриття знань у базах даних). Для обміну даними використовується багато методів машинного навчання, але з різними цілями; з іншого боку, машинне навчання також використовує методи обміну даними як "непідконтрольне навчання" або як крок попередньої обробки для підвищення точності навчання. Значна частина плутанини між цими двома дослідницькими спільнотами (які часто мають окремі конференції та окремі журнали; основним винятком є ​​ECML PKDD) випливає з основних припущень, з якими вони працюють: при машинному навчанні ефективність зазвичай оцінюється щодо здатності відтворювати відомі знання, тоді як у пошуку та знаннях (KDD) ключовим завданням є виявлення раніше невідомих знань. Оцінений за відомими знаннями, неінформований (непідконтрольний) метод буде легко перевершений іншими контрольованими методами, тоді як у типовому завданні KDD контрольовані методи не можуть бути використані через відсутність даних про навчання.
Машинне навчання також має тісні зв'язки з оптимізацією: багато проблем навчання формулюються як мінімізація певної функції втрат на навчальному наборі прикладів. Функції втрати виражають розбіжність між прогнозами моделі, що тренується, і фактичними проблемами (наприклад, в класифікації, хочеться призначити мітку екземплярам, ​​а моделі навчаються правильно прогнозувати попередньо призначені мітки набору приклади). Різниця між двома полями виникає з метою узагальнення: хоча алгоритми оптимізації можуть мінімізувати втрати на навчальному наборі, машинне навчання переймається мінімізацією втрат на невидимі зразки.
Машинне навчання та статистика - це тісно пов’язані сфери з точки зору методів, але чіткі за своєю основною метою: статистика виводить висновки населення із вибірки, а машинне навчання знаходить узагальнюючі прогнозні закономірності. За словами Майкла Іордана, ідеї машинного навчання, від методологічних принципів до теоретичних інструментів, мали давню історію в статистиці. Він також запропонував термін "наука даних" як заповнювач, щоб називати загальне поле.
Лео Брейман розрізняв дві парадигми статистичного моделювання: модель даних та алгоритмічна модель, де "алгоритмічна модель" означає більш чи менш алгоритми машинного навчання, як випадковий ліс.
Деякі статистики прийняли методи машинного навчання, що веде до комбінованого поля, яке вони називають статистичним навчанням.
Основна мета учня - узагальнити його досвід. Узагальнення в цьому контексті - це здатність навчальної машини точно виконувати нові, небачені приклади / завдання, переживши набір даних про навчання. Приклади навчання виходять із деякого загальновідомого розподілу ймовірностей (вважається репрезентативним простором подій), і учень повинен побудувати загальну модель щодо цього простору, яка дозволяє йому створювати достатньо точні прогнози в нових випадках.
Обчислювальний аналіз алгоритмів машинного навчання та їх виконання - це галузь теоретичної інформатики, відома як теорія обчислювального навчання. Оскільки навчальні набори обмежені, а майбутнє невизначене, теорія навчання зазвичай не дає гарантій ефективності алгоритмів. Натомість імовірнісні межі виступу є досить поширеними. Декомпозиція зміщення – дисперсії є одним із способів кількісної оцінки похибки узагальнення.
Для найкращого виконання в контексті узагальнення складність гіпотези повинна відповідати складності функції, що лежить в основі даних. Якщо гіпотеза є менш складною, ніж функція, то модель недоцільна. Якщо складність моделі збільшується у відповідь, то помилка тренувань зменшується. Але якщо гіпотеза занадто складна, то модель, що підлягає переробці, і узагальнення буде біднішою.
Крім меж ефективності, теоретики навчання вивчають часову складність та доцільність навчання. У теорії обчислювального навчання обчислення вважається можливим, якщо це можна зробити в поліномічний час. Є два види складності часу. Позитивні результати показують, що певний клас функцій можна засвоїти в многочлен. Негативні результати показують, що певні класи неможливо засвоїти в поліноміальний час.
Повернутися до початку