Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Переваги і недоліки методів першої і другої групи
Основа методів першої категорії – емпірика, є одночасно їх сильною і слабкою стороною. Велика мінливість об'єкта розпізнавання, залежність вигляду обличчя на зображенні від умов зйомки і освітлення дозволяють без вагань віднести виявлення особи на зображенні до завдань високої складності. Застосування емпіричних правил дозволяє побудувати певну модель зображення обличчя і звести задачу до виконання деякої кількості відносно простих перевірок. Однак, незважаючи на безумовно розумну посилку – спробувати використовувати і повторити вже успішно функціонуючий інструмент розпізнавання – людський зір, методи першої категорії поки далекі по ефективності від свого прообразу, оскільки дослідники, які вирішили обрати цей шлях, стикаються з низкою серйозних труднощів. По-перше, процеси, що відбуваються в мозку під час вирішення задачі розпізнавання зображень вивчені далеко не повністю, і той набір емпіричних знань про людське обличчя, які доступні дослідникам на " свідомому рівні", далеко не вичерпує інструментарій, використовуваний мозком " підсвідомо". По-друге, важко ефективно перевести неформальний людський досвід і знання в набір формальних правил, оскільки надто жорсткі рамки правил приведуть до того, що в ряді випадків особи не будуть виявлені, і навпаки, дуже загальні правила приведуть до великої кількості випадків помилкового виявлення. Можна перерахувати такі проблеми, спільні для методів другої категорії: 1. Залежність від орієнтації і масштабу обличчя. Більшість класифікаторів не є інваріантними до повороту особи в площині зображення і зміни його розміру. Тому для успішного виявлення особи, відмінного за розміром або орієнтації від облич у тренувальному наборі, потрібна додаткова обробка вхідного зображення (масштабування, поворот). Проблему зміни масштабу вирішують, зазвичай, шляхом повного перебору всіх можливих прямокутних фрагментів зображення всіх можливих розмірів. Спроба ж розглядати ще і всі можливі кути повороту осіб у площині зображення приведе до того, що час виконання і без того довгої процедури перебору фрагментів перевищить всі мислимі межі. Якщо говорити про поворот голови поза площиною зображення, то це є проблемою для багатьох методів з обох категорій, оскільки при значному повороті обличчя на зображенні змінюється настільки сильно, що багато ознак і правила (задані розробником або отримані неявно) розпізнавання фронтального зображення обличчя стають абсолютно непридатними. 2. Неявний спосіб визначення ознак для розпізнавання особи таїть в собі потенційну небезпеку: класифікатор, що володіє недостатньо репрезентативним набором зображень облич, теоретично може виділити вторинні або помилкові ознаки в якості важливих. Один з наслідків - потенційна залежність від освітлення, яке переважало в тренувальному наборі. У ряді випадків застосовується додаткова передобробка зображення для компенсації впливу освітлення. 3.Висока обчислювальна складність. По-перше, самі класифікатори часто включають в себе велику кількість досить складних обчислень, по-друге, повний перебір всіх можливих прямокутних фрагментів зображення сам по собі займає велику кількість часу. Це ускладнює використання деяких методів у системах реального часу (наприклад – відстеження переміщення особи в відео потоці). Порівнювати між собою якість розпізнавання методів різних категорій досить важко, оскільки в більшості випадків, спиратися можна лише на дані випробувань, що надаються самими авторами, оскільки провести великомасштабне дослідження щодо реалізації більшості відомих методів і порівняння їх між собою на єдиному наборі зображень не представляється можливим унаслідок неймовірною трудомісткості цього завдання. На основі інформації, наданої авторами методів, також складно провести коректне порівняння, оскільки перевірка методів часто проводиться на різних наборах зображень, з різним формулюванням умов успішного і неуспішного виявлення. До того ж перевірка для багатьох методів першої категорії проводилася на значно менших наборах зображень. Помітне розходження між першою і другою категорією описаних методів полягає ще й у тому, що емпіричні методи часто досить прості в реалізації (особливо щодо методів другої категорії), і надають можливість гнучкого налаштування під конкретну задачу шляхом модифікації інтуїтивно зрозумілих параметрів. Методи, що спираються на інструментарій розпізнавання образів, вимагають значних зусиль з формування тренувальних наборів зображень та навчання класифікатора. Проте трудомісткість створення робочих прототипів методів другої категорії частково компенсується високими заявленими показниками якості розпізнавання на великих колекціях зображень. Що стосується рекомендацій щодо вибору методу для вирішення задачі виявлення осіб, то можна сказати, що обирати відповідний метод, виходячи з цифрових показників якості розпізнавання навряд чи доцільно. Скоріше, все залежить від конкретної задачі і умов в яких повинен функціонувати розроблюваний алгоритм. Побудова універсального методу, що забезпечує високий рівень розпізнавання при відсутності обмежень на вихідні зображення в даний час не представляється можливим, однак для більшості конкретних завдань можна створити методи, що надають достатній рівень розпізнавання. В якості умов, що впливають на вибір методу розв'язання задачі, можна перерахувати такі: · Передбачувана різноманітність осіб: обмежений набір людей, обмеження на можливий тип особи (раса, присутність волосся на обличчі, окулярів і т.д.), відсутність обмежень; · Орієнтація осіб на зображенні: строго вертикальна (або нахил під відомим кутом), в певних межах поблизу відомого кута нахилу, будь-яка; · Кольорове або чорно-біле зображення; · Масштаб облич і якість зображення (зашумленість, ступінь стиснення); · Передбачувана кількість осіб, присутніх на зображенні: відомо, приблизно відомо, невідомо; · Умови освітлення: фіксовані відомі, приблизно відомі, будь-які; · Фон: фіксований, контрастний однотонний, слабоконтрастних зашумлений, невідомий; · Що важливіше – не пропустити ні однієї особи чи мінімізувати кількість випадків помилкового виявлення?
|