LeNet

LeNet – згорткова нейронна мережа

LeNet – це згорткова нейронна мережа (CNN), розроблена Яном ЛеКуном зі співавторами в 1989 році. Вона відіграла значну роль у розвитку глибокого навчання та комп'ютерного зору. LeNet стала основою для багатьох подальших архітектур CNN, зокрема AlexNet та VGGNet.

Архітектура

LeNet складається з семи шарів:

  1. Згортковий шар: Цей шар виконує 5 операцій згортки з використанням фільтрів розміром 5×5. Він зменшує розмірність вхідного зображення та витягує ознаки.
  2. Шар пулінгу: Цей шар виконує операцію пулінгу для зменшення як розмірності, так і варіативності даних.
  3. Згортковий шар: Цей другий згортковий шар знову виконує 5 операцій згортки з використанням фільтрів розміром 5×5. Він додатково витягує ознаки із вхідних даних.
  4. Шар пулінгу: Цей другий шар пулінгу знову зменшує розмірність та варіативність.
  5. Плоский шар: Цей шар розгортає тривимірний шар ознак у одномірний вектор.
  6. Повністю зв'язаний шар: Цей шар представляє повністю зв’язаний нейронний шар з 120 нейронами.
  7. Вихідний шар: Цей шар представляє повністю зв’язаний нейронний шар із 10 нейронами, що відповідають 10 класам цифр (від 0 до 9).
▶️▶️▶️  Взяття Тернополя

Алгоритм тренування

LeNet тренують за допомогою алгоритму зворотного поширення помилки. Цей алгоритм поступово налаштовує ваги та зміщення мережі, щоб мінімізувати функцію втрати, як правило, перехресну ентропію. Функція втрати вимірює різницю між передбачуваним та фактичним вихідними даними мережі.

Застосування

LeNet знайшла застосування у різних областях комп’ютерного зору, зокрема:

  • Розпізнавання рукописних цифр
  • Розпізнавання облич
  • Виявлення об'єктів
  • Сегментація зображень

Обмеження

Хоча LeNet була революційною мережею в той час, вона має кілька обмежень:

  • Глибина: LeNet має порівняно невелику глибину з лише сімома шарами. Це обмежує його здатність витягувати складніші ознаки із зображень.
  • Просторовий розмір: LeNet приймає вхідні зображення лише невеликого просторового розміру (32×32). Це обмежує її здатність обробляти зображення більшого розміру.
  • Обчислювальна складність: LeNet є обчислювально дорогою мережею, особливо для великих наборів даних.

LeNet – це проривна згорткова нейронна мережа, яка зробила значний внесок у розвиток комп'ютерного зору. Незважаючи на свої обмеження, вона залишається історичною мережею, яка надихнула багато подальших розробок у сфері глибокого навчання.

▶️▶️▶️  CEB

Поширені запитання

  1. Який розмір вхідних зображень для LeNet?

    • 32×32 пікселі
  2. Скільки шарів у LeNet?

    • 7
  3. Який тип алгоритму тренування використовується для LeNet?

    • Зворотне поширення помилки
  4. Які застосунки має LeNet?

    • Розпізнавання рукописних цифр, розпізнавання облич, виявлення об'єктів, сегментація зображень
  5. Які обмеження має LeNet?

    • Невелика глибина, обмежений просторовий розмір вхідного зображення, висока обчислювальна складність

Залишити коментар

Опубліковано на 14 05 2024. Поданий під Вікі. Ви можете слідкувати за будь-якими відповідями через RSS 2.0. Ви можете подивитись до кінця і залишити відповідь.

ХОЧЕТЕ СТАТИ АВТОРОМ?

Запропонуйте свої послуги за цим посиланням.

Останні новини

Контакти :: Редакція
Використання будь-яких матеріалів, розміщених на сайті, дозволяється за умови посилання на Reporter.zp.ua.
Редакція не несе відповідальності за матеріали, розміщені користувачами та які помічені "реклама".