Штучні нейронні мережі (ANNs) або коннекціоністські системи - це обчислювальні системи, натхнені біологічними нейронними мережами, що складають мозок тварин. Такі системи вчаться (поступово вдосконалюють свою здатність) виконувати завдання, розглядаючи приклади, як правило, без програмування конкретного завдання. Наприклад, при розпізнаванні зображень вони можуть навчитися визначати зображення, які містять котів, аналізуючи приклади зображень, які були вручну позначені як "кішка" або "ні кішка", і використовуючи аналітичні результати для ідентифікації котів на інших зображеннях. Вони знайшли найбільше використання в додатках, які важко виразити за допомогою традиційного комп’ютерного алгоритму, використовуючи програмування на основі правил.
ANN базується на сукупності з'єднаних одиниць, званих штучними нейронами (аналогічно біологічним нейронам у біологічному мозку). Кожен зв’язок (синапс) між нейронами може передавати сигнал іншому нейрону. Приймаючий (постсинаптичний) нейрон може обробляти сигнал (и), а потім подавати сигнал до нейронних каналів, що підключаються до нього. Нейрони можуть мати стан, як правило, представлений реальними числами, як правило, між 0 і 1. Нейрони і синапси також можуть мати вагу, яка змінюється в міру проходження навчання, що може збільшувати або зменшувати силу сигналу, який він посилає вниз за течією.
Як правило, нейрони організовані шарами. Різні шари можуть виконувати різні види перетворень на своїх входах. Сигнали переходять від першого (вхідного) до останнього (вихідного) шару, можливо, після проходження шарів кілька разів.
Початкова мета підходу нейронної мережі полягала в тому, щоб вирішити проблеми так само, як і людський мозок. З часом увага зосереджувалася на узгодженні конкретних розумових здібностей, що призводить до відхилень від біології, таких як зворотне розповсюдження, або передачі інформації у зворотному напрямку та пристосування мережі до відображення цієї інформації.
Нейронні мережі використовувались у різних завданнях, включаючи комп’ютерний зір, розпізнавання мови, машинний переклад, фільтрація в соціальній мережі, ігрові дошки та відеоігри та медичну діагностику.
За станом на 2017, нейронні мережі зазвичай мають від декількох тисяч до кількох мільйонів одиниць і мільйонів з'єднань. Незважаючи на те, що це число на кілька порядків менше, ніж кількість нейронів в людському мозку, ці мережі можуть виконувати багато завдань на рівні, що перевищує рівень людського (наприклад, розпізнавання облич, граючи в «Ідіть»).
Глибока нейронна мережа (DNN) - це штучна нейронна мережа (ANN) з декількома шарами між вхідним і вихідним шарами. DNN знаходить правильну математичну маніпуляцію, щоб перетворити вхід на вихід, будь то лінійне відношення чи нелінійне відношення. Мережа рухається через шари, обчислюючи ймовірність кожного виходу. Наприклад, DNN, який навчений розпізнавати породи собак, перейде за даним зображенням і обчислить ймовірність того, що собака на зображенні є певною породою. Користувач може переглянути результати та вибрати, які ймовірності має відображати мережа (понад певний поріг тощо) та повернути запропоновану мітку. Кожна математична маніпуляція як така вважається шаром, а складні DNN мають багато шарів, звідси і назва "глибокі" мережі.
DNN можуть моделювати складні нелінійні відносини. Архітектури DNN генерують композиційні моделі, де об'єкт виражається як багатошаровий склад примітивів. Додаткові шари дозволяють складати функції з нижчих шарів, потенційно моделюючи складні дані з меншою кількістю одиниць, ніж подібна мілка мережа.
Глибока архітектура включає безліч варіантів кількох базових підходів. Кожна архітектура знайшла успіх у конкретних областях. Не завжди можливо порівняти ефективність декількох архітектур, якщо вони не були оцінені на одних і тих же наборах даних.
DNN - це, як правило, прямі мережі, в яких дані протікають від вхідного шару до вихідного рівня без циклу назад. Спочатку DNN створює карту віртуальних нейронів і присвоює випадкові числові значення, або "ваги", для зв'язків між ними. Ваги і введення множуються і повертають вихід між 0 і 1. Якщо мережа не точно розпізнала певний зразок, алгоритм буде коригувати ваги. Таким чином алгоритм може зробити певні параметри більш впливовими, поки він не визначить правильну математичну маніпуляцію для повного опрацювання даних.
Повторні нейронні мережі (RNN), в яких дані можуть надходити в будь-якому напрямку, використовуються для таких програм, як мовне моделювання. Довга короткочасна пам'ять особливо ефективна для цього використання.
Конволюційні глибокі нейронні мережі (CNN) використовуються в комп'ютерному зорі. CNN також застосовуються для акустичного моделювання для автоматичного розпізнавання мови (ASR).

Повернутися до початку