ТЕХНИЧЕСКОЕ ЗРЕНИЕ
|
||||||||||||||||||||
Чтобы не усложнять описание вычислительных процедур совершенно непринципиальными подробностями, которые связаны с эффектами, возникающими при попадании квадрата усреднения на края матриц, все формулы записываются в предположении справедливости таких неравенств:
Необходимо упомянуть следующее. Выполнение операции усреднения (расфокусировки) занимает в настоящее время большую часть времени счёта сети. Легко может быть создано специализированное быстродействующее устройство, предназначенное для реализации расфокусировки матриц заданного размера. Из нейрофизиологических исследований известно, что в нервной системе живых организмов широко распространено торможение [78, 90]. Материальным субстратом тормозных эффектов являются тормозные нейроны и структура их связей. В искусственной нейроподобной сети тормозное воздействие также может осуществляться специально введёнными тормозными нейроподобными элементами. Более простой путь моделирования явления торможения состоит в том, что в нейроподобной сети постулируется наличие двух типов связей, соединяющих выход одного нейроподобного элемента со входом другого. Один тип связи имеет возбуждающий характер, другой — тормозной. В настоящей работе принято, что тормозное воздействие полностью симметрично возбуждающему. Выходной потенциал нейроподобного элемента передается на вход другого нейроподобного элемента через возбуждающую связь со знаком плюс, а через тормозную связь — со знаком минус. Одновременно приходящие на нейроподобный элемент возбуждающие и тормозные воздействия алгебраически суммируются на его входе. По аналогии с электротехникой в данной главе термин вес связи, используемый в других частях книги, переименован в проводимость связи. Кроме того, для удобства написания формул вводится также сопротивление связи (величина, обратная проводимости). Работа модели начинается с серии последовательных преобразований исходного изображения. Дело в том, что исходное изображение может иметь избыточный, недостаточный или резко неоднородный уровень освещения. Поэтому цель упомянутых преобразований заключается в компенсации подобных дефектов освещения и в приведении изображения к стандартному виду, оптимальному для последующей обработки.
На рис. 6.1 представлен зрительный эффект использования этой операции, он состоит из трёх частей, каждая из которых представляет собой фотографию половины экрана телевизора — полукадр. Всего на телевизионный экран выводится 128 × 128 яркостных точек, имеющих по 64 градации яркости каждая. Соответственно в полукадре содержится 128 × 64 таких точек. В верхнем полукадре помещено исходное изображение. Ниже — одно под другим — два преобразованных описанной процедурой изображения: n = 7 и n = 31 (размер окна расфокусировки в формуле (6.4)). Следующая трансформация изображения, осуществляемая моделью, заключается (согласно п. 3) в приведении интервала разбросов яркостных значений на изображении к стандартной величине. Для этого изображение, полученное моделью в результате применения описанной выше процедуры, подвергается расфокусировке. В расфокусированном изображении отыскивается максимальное значение яркости М'', т. е.
Обозначим М — максимально возможное значение яркости в изображении. Тогда данное преобразование можно выразить следующей формулой:
Описываемое формулой (6.6) преобразование трансформирует изображение таким образом, что максимум яркости матрицы [I''i,j] приближается к величине М. При этом все остальные детали изображения пропорционально изменяют свою яркость.
Цель всех трансформаций исходного изображения заключается в том, чтобы обеспечить наилучшие условия для выделения признаков на нём. Согласно общепринятым представлениям об алгоритмах распознавания зрительных образов основой, на которой происходит формирование большинства признаков, служат линии границ образов объектов на изображении. На трёхмерном яркостном рельефе, образующемся в слое рецепторных элементов при восприятии изображения, края объектов часто предстают в виде границ между областями, обладающими различными зрительными характеристиками, в частности различной яркостью. Наиболее просто выделяются на изображении крутые перепады яркости между соседними однородными областями, т. е. контуры. Известно, что в зрительных анализаторах всех живых организмов происходит выделение (подчёркивание) контуров [24, 39, 57, 78]. Технические устройства, имеющие дело с изображениями реальных объектов, как правило, также осуществляют выделение контуров в изображениях на одном из начальных этапов обработки информации [17, 32, 39, 40, 70, 75, 79, 80]. Таким образом, представляется обоснованной необходимость выделения контуров для отделения от фона и (или) друг от друга образов объектов на изображении. Однако выбор среди выделенных контуров границ объектов является совсем не простой задачей. Подводя итог сказанному можно заключить, что одной из целей серии трансформаций исходного изображения является создание оптимальных условий для выделения контуров. В настоящее время предложено множество методов для выделения контуров [16, 18, 24, 36, 39, 40, 57, 70, 79]. Все они имеют дело с градуальными значениями яркости в некотором компактном множестве дискретов растра. В связи с этим возникают следующие соображения. Для предварительного анализа изображения, в частности для задачи яркостной сегментации изображения, предполагается, что выделение контуров, расположенных внутри областей, обладающих достаточно высоким или, наоборот, слишком низким уровнем освещённости, является излишним. Данное предположение вытекает из наблюдения, что при первом взгляде на зрительную картину человек плохо различает слабоконтрастные детали на слишком ярком или слишком тёмном фоне. Все слабо или сильно освещённые области воспринимаются им (в первый момент) как бесструктурные. Для реализации этого предположения в модели введен слой нейроподобных элементов, имеющих существенно нелинейную S-образную статическую выходную характеристику, представленную на рис. 6.3. Изображение, полученное последовательным применением двух описанных выше операций, на третьем этапе обработки зрительной информации преобразуется таким слоем в матрицу [I'''i,j]. Обозначая процедуру, которую выполняет слой нелинейных нейроподобных элементов через S(хi,j), можно записать Рис. 6.3 — S-образная выходная характеристика нейрона Функциональный смысл данной операции состоит в том, что яркость слишком или недостаточно ярких деталей изображения изменяется: яркие участки становятся ещё более яркими, тёмные — темнеют, а яркость областей, находящихся в среднем диапазоне яркостей, остаётся неизменной. Вследствие этого в области, относящейся к одной из крайних групп, уменьшается разброс яркостных значений, следствием чего является уменьшение вероятности выделения контуров внутри такой области. Необходимо отметить, что обе предыдущие операции требуют для своей реализации в виде нейроподобных структур линейности статической выходной характеристики каждого нейроподобного элемента. Известно, что обобщенная выходная характеристика биологического нейрона имеет S-образную форму, близкую к показанной на рис. 6.3. Поэтому можно предположить, что операция, рассмотренная здесь в качестве третьего этапа предварительной обработки зрительной информации, автоматически выполняется в реальных нейронных структурах (и может быть неоднократно) в процессе любой обработки зрительной информации нервной сетью. К сожалению, зрительные эффекты, возникающие в результате передачи изображения через слой элементов с S-образной выходной характеристикой, выражены довольно слабо и на фотографиях теряются. Поэтому описанная операция здесь не иллюстрируется. В модели контуры выделяются с помощью трёх слоев нейроподобных элементов, сохраняющих топологическое соответствие со слоем рецепторов. Рецептивные поля нейроподобных элементов первых двух слоёв имеют форму квадрата. Площади рецептивных полей нейроподобных элементов одного слоя, так же, как и размеры рецептивного поля элементов одного слоя, равны между собой. Размер рецептивного поля элементов первого слоя превышает размер рецептивного поля элементов второго слоя. Функция, которую выполняют оба слоя нейроподобных элементов, заключается в усреднении или же в расфокусировке исходного изображения. Третий слой выполняет операцию вычитания одного расфокусированного изображения из второго. Поскольку степень расфокусировки в первых двух слоях разная, то в третьем слое активность элементов выделяет границы более или менее равномерно освещённых областей. Из приведенного описания следует, что нейроподобные элементы третьего слоя структуры являются аналогами нейронов — детекторов, контраста, широко распространенных в зрительной системе всех высших живых организмов [78]. Настройка алгоритма на выделение границ областей с теми или иными зрительными характеристиками осуществляется подбором двух параметров: размерами большого и размерами малого рецептивного поля нейроподобных элементов третьего слоя. Чем меньше размер малого рецептивного поля, тем более точно очерчивается граница области, но вместе с тем увеличивается количество ложных контуров, отражающих случайные скачки яркости на (в целом) равномерно освещённой области. Чем больше размер малого рецептивного поля, тем, соответственно, более сглаженными становятся границы областей, но и ложных контуров на изображении появляется меньше. Расфокусировка изображения малым рецептивным полем диктуется необходимостью сглаживания структурных элементов изображения, размер которых меньше заданной величины, которая, в свою очередь, определяется степенью приблизительности, с которой требуется найти границы областей в процессе яркостной сегментации изображения. Из изложенного выше следует, что трёхслойная структура реализует собой граничный интегро-дифференциальный оператор, аналогичный ∇2G-фильтру, описанному в работе [57]. Таким образом, можно сказать, что преобразование изображения трёхслойной структурой эквивалентно вычислению отклика в результате осуществления свёртки указанного оператора с изображением. Нулевые значения преобразованного изображения (отклика) рассматриваются в работе [57] в качестве контуров. Под термином контур обычно понимается линия, ширина которой не превышает один дискрет растра. В отличие от этого в настоящей работе под контуром понимается любое множество дискретов растра, полученное в результате вычисления приведённых ниже формул. Другими словами, здесь на ширину контурных линий не накладывается никаких ограничений. Кроме контурных линий, фиксированных в бинарных матрицах, в модели используется контурная, функция ki,j, представляющая собой положительную часть отклика:
Чтобы объяснить функциональный смысл следующей операции, необходимо описать такой психологический феномен. При беглом взгляде на зрительную картину в ходе предварительной сегментации изображения человеком наличие резкого и протяженного контраста в какой-либо области изображения маскирует присутствие в некоторой его окрестности слабоконтрастных деталей изображения. Для реализации в модели этого наблюдения предварительно усреднённая матрица контурной функции вычитается из матрицы контурной функции, затем результат сравнивается с фиксированным порогом, вследствие чего образуется двоичная матрица контуров [ci,j(n1, n2)]. Таким образом, Механизм яркостного анализа предполагает одновременное применение в модели нескольких трёхслойных структур описанного выше типа для выделения контуров в изображении. Однако в отличие от алгоритма, предложенного Марром [57], разница между трёхслойными структурами в модели заключается в том, что при переходе от одной структуры к другой происходит изменение размеров рецептивных полей, но не обоих сразу, а только одного из них — большего (n1). Малое рецептивное поле (n2) всех трёхслойных структур имеет в модели один и тот же размер. Контуры, выделенные в изображении набором трёхслойных структур и превращенные в двоичные линии в соответствии с формулой (6.9), суммируются в одной двоичной матрице [ci,j] с помощью операции дизъюнкции: Рис. 6.4 На рис. 6.4 представлено действие механизмов, описанных формулами (6.8) и (6.10). Здесь верхний полукадр эквивалентен матрице [I'''i,j], второй сверху полукадр соответствует матрице [ki,j] с тем отличием, что с целью создания зрительного изображения выделенных контуров (светлым на тёмном фоне) пришлось умножить [ki,j] на коэффициент пропорциональности ≈15, нижний полукадр демонстрирует результат последовательного применения к исходному изображению всех описанных выше процедур — выделенные из этого изображения контуры, т. е. [ci,j] (светлые точки). Основой модели служит слой нейроподобных элементов, связанных друг с другом регулярной структурой возбуждающих и тормозных связей. Взаимные (двойные) возбуждающие связи, имеющие одинаковую проводимость RB, соединяют каждый нейроподобный элемент слоя (не краевой) с его соседями, расположенными в границах квадрата, центром которого является рассматриваемый нейроподобный элемент. Сторона квадрата содержит nB дискретов растра. Структура тормозных связей каждого нейроподобного элемента имеет точно такой же вид. Отличие заключается только в значениях параметров. Размер квадрата тормозных связей nT превышает величину nB; проводимость тормозных связей RT меньше, чем значение RB. Благодаря такой структуре связей нейроподобные элементы слоя, находящиеся друг от друга на расстояниях, меньших, чем (nT + 1)/2, взаимоусиливают свою активность. С ростом расстояния между ними до (nB + 1)/2 характер взаимодействия меняется на взаимотормозный. Элементы, расположенные ещё дальше друг от друга, непосредственно не взаимодействуют. Контуры, выделенные на предыдущем этапе анализа изображения, используются в модели для тормозного воздействия на слой нейроподобных элементов с ближними связями. Структурно это реализовано слоем специальных элементов (представляющих элементы двоичной матрицы [сi,j]), от которых направленные тормозные связи, имеющие проводимость, равную r, передают тормозное воздействие на входы соответствующих нейроподобных элементов слоя ближних связей. На слой ближних связей поступает также и возбуждающее воздействие. Для этого структура сети дополняется ещё одним слоем, цель введения которого заключается в представлении дважды преобразованного изображения, т. е. матрицы [I''i,j]. От элементов такого слоя через направленные связи с проводимостью, равной ρ, на каждый нейроподобный элемент слоя ближних связей подаётся возбуждающее воздействие, величина которого в значительной степени определяется уровнем освещенности соответствующего дискрета растра рецепторов. Таким образом, согласно приведенному описанию, суммарное воздействие на входе i, j-го нейроподобного элемента слоя ближних связей в произвольный момент времени t вычисляется по формуле Из-за смешанного возбуждающе-тормозного внешнего воздействия на нейроподобные элементы слоя с ближними связями и взаимодействия его элементов в слое начинает нарастать суммарный уровень активности. Причём распределение активности по слою оказывается очень неравномерным; наибольший уровень активности достигается в тех участках слоя, где на изображении находятся наиболее яркие, компактные, бесконтурные области, имеющие сравнительно большие размеры и в целом выпуклую форму. Малые, слабо освещённые и многоконтурные области не активируются в слое до сколько-нибудь значительного уровня. Через некоторое время после предъявления нейроподобной сети изображения в слое ближних связей устанавливается стабильный паттерн активности. Следующий слой пороговых элементов служит для выделения нейроподобных элементов слоя ближних связей, выходные потенциалы которых превышают постоянное, заранее заданное значение. Другими словами, выявление искомых областей производится посредством горизонтального среза рельефа установившейся активности нейроподобных элементов в слое ближних связей. Дискреты, в которых расположены активированные элементы порогового слоя, относятся моделью к искомым областям. Таким образом, благодаря сочетанию тормозного и возбуждающего воздействия на слой нейроподобных элементов с ближними связями в нём происходит выделение некоторого количества компактных участков, соответствующих наиболее ярким, большим, бесконтурным областям на исходном изображении. Роль тормозных связей между элементами слоя заключается в следующем. Операция выделения областей нейроподобной сетью согласно приведённому описанию выполняется параллельно по всему растру. Это означает, что несколько соседних областей одновременно расширяют площадь, занятую активированными пороговыми элементами. Благодаря наличию тормозной окантовки вокруг каждой такой области в случае совмещения двух окантовок соседних областей с узким промежутком между контурами, ограничивающим распространение возбуждения по слою, в процессе роста активности в слое не происходит слияния рассматриваемых областей в одну. Другими словами, эффект тормозной окантовки областей в слое в сочетании с тормозным воздействием контуров на слой позволяет осуществить операцию градуального «окукливания» ярких областей на изображении. Для упрощения расчёта в ЭВМ нейроподобной сети принято λ = τ. Тогда уравнение (6.11) приобретает вид Для численного решения системы из p×m уравнений (6.13) вводится тактированное машинное время t с интервалом между тактами Δt: из уравнения (6.13), в результате, получаем Подстановка (6.12) в (6.14) даёт формулу, по которой в модели осуществляется последовательный пересчёт выходных потенциалов нейроподобных элементов слоя ближних связей (элементов матрицы [Pti,j]): Выделенные пороговым слоем вершины рельефа установившейся активности нейроподобных элементов слоя ближних связей представляются единицами в двоичной матрице [ati,j] в соответствии с формулой Рис. 6.5 Работа модели прекращается после пересчёта в ЭВМ заданного количества тактов, которое выбирается из тех соображений, чтобы в слое ближних связей успел установиться постоянный паттерн активности. Обозначим двоичную матрицу, в которой фиксируется результат работы описанной модели, через [аi,j]. Для ввода изображений в ЭВМ, контроля промежуточных результатов и вывода результатов работы модели использовался комплекс, содержащий телекамеру, кадровую память размером 128 × 128 6-битовых слов, ЭВМ СОУ-1 и цветной телевизор. С помощью этого комплекса алгоритм яркостного анализа был проверен на изображениях природных объектов. На рис. 6.5 – 6.7 представлены фотографии экрана телевизора: в верхнем полукадре помещено исходное изображение, в нижнем — выделенные программой области. На рис. 6.5 представлено негативное изображение опушки леса, на рис. 6.6 тропинка в траве, на pиc. 6.7 образцы двух текстур. На рис. 6.5, кроме работы программы, продемонстрировано то, что самые тёмные области изображения выделяются тем же самым алгоритмом при условии обработки им изображения, предварительно превращенного в негативное. Рис. 6.6 Рис. 6.7 В заключение отметим следующее. Как вытекает из всего изложенного, моделирование нейроподобной сети в настоящей работе базируется на операции расфокусировки матрицы. Причём указанная операция выполняется с помощью процедуры усреднения (формула (6.1)). Усреднение по квадрату со стороной n фактически реализует в модели ближние связи одинаковой проводимости, соединяющие друг с другом все нейроподобные элементы сети, расположенные внутри квадрата со стороной, равной n. В то же время, нейрофизиологические источники свидетельствуют, что взаимодействие нейронов в живых нервных сетях зрительного анализатора ослабляется с ростом расстояния между ними [47, 78]. С другой стороны, из общих рассуждений вытекает, что для максимально возможной равномерности расфокусировки (размывания) изображения, вносящей минимальные искажения в исходное изображение, упомянутая процедура должна производиться с помощью колоколообразного оператора, описываемого распределением Гаусса [57]. Для учёта этих фактов в модели, очевидно, необходимо предусмотреть уменьшение проводимостей как возбуждающих, так и тормозных связей в слоях с увеличением расстояния между нейроподобными элементами слоёв. Это не было сделано в данной работе по причине вычислительной сложности реализации такого распределения связей в слое. Известно, что слой нейроподобных элементов, в котором достаточно точно промоделирован колоколообразный закон убывания проводимостей ближних связей нейроподобных элементов друг с другом, обладает многими полезными свойствами [58]. Таким образом, изложенное даёт основание надеяться, что в случае замены операции усреднения (формула (6.1)) оператором колоколообразного вида при полной неизменности всех остальных алгоритмов модели результаты обработки изображения моделью должны улучшиться. 6.2. Очерчивание границ яркостных пятен на изображенииСогласно приведённому описанию, яркостный анализ позволяет в ходе параллельного процесса выделить все наиболее яркие и протяженные пятна на изображении. Однако если параметры модели подобраны правильно, то каждая выделенная сетью область в большинстве случаев находится внутри действительных границ пятна. При этом чем меньше яркость пятна, тем больше разница между выделенной областью и пятном как по площади, так и по форме. Соответственно, чем больше яркость пятна, тем ближе выделенная сетью область к действительной форме пятна. Из последнего утверждения вытекает, что наиболее точно сеть выделяет форму самого яркого пятна на изображении. Цель яркостной сегментации изображения состоит в том, чтобы очертить границы всех равномерно освещённых областей изображения. Отсюда следует, если искусственно преобразовать исходное изображение таким образом, чтобы при этом яркость выбранного пятна изменилась и достигла максимально возможного уровня, а затем произвести яркостный анализ такого изображения, то форма этого пятна будет, в результате, выделена гораздо точнее, чем в случае отсутствия предварительной коррекции его яркости. Данную операцию можно последовательно применить к каждой равномерно освещенной области изображения и тем самым решить задачу сравнительно точного очерчивания границ всех равномерно освещённых областей изображения. Таким образом, в краткой формулировке смысл описываемого ниже алгоритма заключается в последовательном привлечении внимания ко всем равномерно освещённым областям на изображении. Алгоритм очерчивания формы яркостных пятен на изображении состоит из циклов, количество которых равно числу областей одинаковой освещённости, обнаруженных на изображении. Каждый цикл представляет собой процесс яркостного анализа изображения, подробно изложенный выше, в который внесены сравнительно незначительные изменения. Согласно описанию алгоритма яркостного анализа исходное изображение преобразуется моделью с целью создания оптимальных условий для его последующей обработки. Затем в изображении выделяются контуры. Тормозно-возбуждающее воздействие от контуров и трансформированного изображения подается на слой нейроподобных элементов с ближними связями. Начинается активация нейроподобных элементов слоя. Однако здесь, как только выходной потенциал хотя бы одного нейроподобного элемента слоя достигает порога (L), ход процесса яркостного анализа нарушается. В каждый такт машинного времени вычисляется уравнение По условию dt ≠ 0 определяется момент , с которого начинается выполнение следующей последовательности операций. Прежде всего осуществляется поиск самого возбуждённого нейроподобного элемента слоя ближних связей Координаты этого элемента матрицы [рi,j] запоминаются в специальной бинарной матрице [bi,j], в которой только один элемент равен единице, все остальные являются нулями. Функциональный смысл данной операции заключается в том, что соответствующий дискрет растра в дальнейшем используется в качестве идентификатора области, на которой концентрируется внимание модели в текущем цикле работы алгоритма. (Как показано в параграфе 6.3, упомянутый дискрет располагается вблизи центра вписанного в область квадрата.) Это даёт возможность приблизительно оценить яркость рассматриваемого пятна. Определим названную величину (обозначим её М') формулой Формула (6.19) означает, что яркость области оценивается значением освещённости расфокусированного изображения в выделенном дискрете растра. Затем исходное изображение преобразуется в соответствии с формулой (6.6) при условии замены в ней М" на М'. Как упоминалось в параграфе 6.1, описываемое формулой (6.6) преобразование трансформирует исходное изображение таким образом, что оценка яркости рассматриваемого пятна максимально приближается к величине М. После того как получено преобразованное согласно формуле (6.6) изображение (обозначим его матрицей [I1i,j]), оно рассматривается моделью в качестве исходного, и весь процесс анализа яркости начинается сначала, проводится в полном объёме, включая все преобразования, выделение контуров и прочее и на этот раз доводится до конца, т. е. до выделения в матрице [аi,j] нескольких областей. Поскольку матрица [I1i,j] в общем случае существенно отличается от исходного изображения, то форма некоторых областей, выделенных в [аi,j], может частично не соответствовать исходным яркостным пятнам. Однако форма области, для которой проводится этот цикл анализа, оказывается выделенной сравнительно более точно, чем в случае анализа исходного изображения. Для того чтобы описать алгоритм выявления
искомой области в матрице [аi,j], необходимо ввести
операцию однократного расширения бинарной матрицы [xi,j].
Пусть матрица содержит произвольное число нулей и единиц. Каждый
единичный элемент матрицы, расположенный не на её краю, имеет восемь
соседей. Операция заключается в присваивании единичных значений всем
восьми соседям каждого единичного элемента матрицы. Обозначим Φ[xi,j]
— операция расширения произвольной двоичной матрицы [xi,j];
[u1i,j],
[u2i,j], ...,
[uφi,j] и Матрица [sφi,j] определяется из условия Набор матричных операций, определяемый формулами (6.20) и (6.21), обозначим через W, тогда Результаты работы алгоритма (для дальнейшего использования) переносятся в специальную двоичную матрицу [zi,j], все элементы которой в начальный момент времени имеют нулевые значения. Обозначим последовательность циклов анализа изображения рядом индексов 1, 2, 3, q, .... v. Тогда в q-м цикле анализа матрица [zi,j] определяется по формуле Индекс q в обозначении элемента матрицы [sφ,qi,j] указывает, что в формуле (6.23) операция дизъюнкции выполняется с участием элементов матрицы [sφ,qi,j], вычисленной по формуле (6.22) в q-м цикле анализа изображения. Следует отметить, что, строго говоря, все формулы, описывающие работу алгоритма, должны включать в свои обозначения индекс цикла. Это не было сделано из опасения переусложнить написание указанных формул. После того как выделенная в данном цикле область перенесена на матрицу [zqi,j], начинается следующий цикл анализа. Модель приступает к выделению нового яркостного пятна в изображении. Для того чтобы исключить повторную концентрацию внимания на уже обработанных пятнах, в модели предусмотрено выполнение операции конъюнкции матриц [ati,j] и [zqi,j] на каждом такте этапа выявления дискрета-идентификатора области, которую алгоритм будет выделять на (q + 1)-м цикле работы. В соответствии с этим формула (6.17) должна быть переписана в следующем виде: Теперь необходимо отметить следующее. Поскольку в результате каждого цикла яркостного анализа изображения выделяется только одна область (на которой в данный период времени сконцентрировано внимание модели), то совершенно не обязательно делать яркостный анализ целого растра, т. е. полного изображения. Вполне достаточно рассмотреть лишь сравнительно небольшой участок растра — назовём его полем внимания. Центром этого поля, естественно, должно быть выделяемое в текущем цикле анализа яркостное пятно. Из описания механизма взаимодействия нейроподобных элементов слоя ближних связей следует, что для более точного определения формы области требуется наличие в поле не одной выделяемой области равной освещённости, а комплекса, содержащего центральное пятно и окружающие его области изображения. Площадь яркостных пятен, для выделения которых предназначена модель, может быть существенно различной. Поэтому поле внимания должно иметь такие размеры, которые гарантировали бы включение в него любого комплекса. Высказанные соображения относительно (уменьшенного по сравнению с полем зрения — растром) поля внимания носят чисто теоретический характер, поскольку в реализованной модели в качестве поля внимания используется весь растр.
В верхней части рис. 6.8 представлено исходное изображение; второй сверху полукадр демонстрирует области, выделенные на изображении в процессе однократного применения процедуры яркостного анализа; нижняя фотография показывает те же области, выделенные в результате многократного использования упомянутой процедуры в соответствии с описанным здесь алгоритмом. В п. 5 нейрофизиологических принципов, на которых основывается структурно-функциональная организация модели, говорится о том, что предварительной обработкой изображения в живых нейронных сетях параллельно занимаются две почти полностью симметричные подсистемы. Из нейрофизиологических данных можно сделать вывод, что одна подсистема осуществляет выделение ярких пятен на изображении, а другая — тёмных [78, 87]. В соответствии с обозначениями, введёнными выше, негативное изображение (обозначим его [Ĭi,j]) можно получить из предварительно нормализованного изображения [I''i,j] по формуле Для полной яркостной сегментации изображения оба его варианта — позитивный и негативный, — очевидно, должны обрабатываться моделью независимо друг от друга почти до самого конца процесса. Сопоставление результатов работы модели над обоими вариантами изображения требуется проводить только для того, чтобы избежать ненужного дублирования, т. е. выделения моделью одних и тех же областей равной освещённости на обоих вариантах изображения. Для достижения указанной цели, алгоритм полной яркостной сегментации изображения состоит из двух одинаковых частей (подсистем). Обе части алгоритма работают одновременно. Одна подсистема обрабатывает позитивное изображение, другая негативное. Введём, по аналогии с формулой (6.25), знак «~» для обозначения величин, вычисляемых подсистемой, которая имеет дело с негативным вариантом изображения. В конце каждого цикла яркостного анализа, после того, как в обоих подсистемах модели в матрицах [sφ,qi,j] и [φ,qi,j] оказывается по одной вновь выделенной области, эти области сравниваются, т. е. выполняется операция Удовлетворение неравенству На рис. 6.9 представлено, в качестве дополнения к рис. 6.8, функционирование той части модели, которая обрабатывает негативный вариант изображения. В верхней части рис. 6.9 помещён негативный вариант изображения (позитивный вариант расположен в верхней части рис. 6.8). Средний полукадр рис. 6.9 показывает выделенные в изображении области в результате параллельного процесса яркостного анализа изображения. Нижняя фотография показывает те же области, выделенные в ходе последовательного применения процедуры яркостного анализа ко всем яркостным пятнам изображения. 6.3. Подсчёт компактных областей на изображенииПроцедура сегментации изображения, т. е. разделение областей на изображении, различающихся по зрительным характеристикам, немыслима без выделения текстурных областей. Для разделения текстурных областей и распознавания текстур предложено множество алгоритмов [111]. Многие из них для решения задачи используют текстурные признаки, в качестве которых обычно выбирают признаки нелокального типа. Имеется в виду, что текстурный признак представляет собой некоторую совокупную характеристику сравнительно большого количества дискретов исходного изображения. Как правило, упомянутые дискреты образуют компактную область на растре (квадратное окно, часть строки растра, часть столбца растра). В данной работе предполагается отнесение текстурного признака к квадратному окну заданного размера. Рассмотрим случай, когда текстура имеет отчётливый текстурный рисунок. Наблюдения показывают, что наличие в текстуре чётко выделяемых структурных элементов (рисунка) часто сочетается с тем, что участки изображения, занятые рисунком, предстают для человеческого глаза в виде бесконтурных или даже равномерно освещённых областей. В параграфах 6.1 и 6.2 показано, что именно такие области могут быть выделены на изображении с помощью яркостного анализа. В результате применения процедуры яркостного анализа к исходному изображению из текстурного рисунка посредством параллельного процесса выделяются компактные области примерно одинакового размера — «зерна». Наличие зёрен того или иного размера в текстуре является важной отличительной особенностью данной текстуры. Плотность распределения «зёрен» в текстуре также представляет собой определённую характеристику текстуры. Поэтому в качестве одного из текстурных признаков естественно выбрать количество «зёрен» заданного размера, расположенных в стандартном квадрате растра. Содержательно этот признак, который условно можно назвать «зернистостью», даёт некоторую интегральную оценку степени упорядоченности распределения яркостных значений по элементам растра в исходном изображении. Однако для определения значения введённого признака зернистости недостаточно только выделить зёрна на изображении, надо ещё подсчитать их количество. Для этого, очевидно, необходимо превратить каждое «зерно» в единичную точку на растре, после чего легко произвести требуемый подсчёт. В данном параграфе предлагается параллельный алгоритм, превращающий произвольнее количество компактных областей в единичные точки, расположенные в ближайшей окрестности центров вписанных в них максимальных квадратов. Известны задачи, которые сводятся к поиску центров нескольких несвязных областей на растре [61]. Основой предлагаемого алгоритма является модель структурированной нейроподобной сети, реализованной в виде программы для ЭВМ. Работа алгоритма начинается с того, что заданные области фиксируются в специальном бинарном растре в виде единичных значений соответствующих дискретов растра. Бинарный растр, таким образом, служит для описываемой системы рецепторным слоем. Большая часть обработки информации в системе происходит в слое нейроподобных элементов с ближними связями. Выходной потенциал i, j-го нейроподобного элемента слоя Рi,j(t) вычисляется по формуле Каждый нейроподобный элемент имеет взаимные возбуждающие связи одинаковой проводимости ψ со всеми соседями, расположенными в некоторой окрестности вокруг рассматриваемого элемента. Ячейки памяти упомянутого выше бинарного рецепторного слоя попарно соединены возбуждающими или тормозными связями с соответствующими нейроподобными элементами слоя ближних связей. Структура связей изменяется в процессе работы алгоритма таким образом, что в любой момент времени единичные ячейки памяти оказывают на соответствующие нейроподобные элементы возбуждающее воздействие с коэффициентом передачи, равным ω, а нулевые ячейки — тормозное воздействие с бесконечно большим коэффициентом передачи. Благодаря такому комбинированному возбуждающе-тормозному влиянию, поступающему с рецепторного слоя, в слое ближних связей начинает возрастать уровень активности нейроподобных элементов, соответствующих исходно зафиксированным в рецепторном слое единичным областям. Радиус действия ближних связей, соединяющих нейроподобные элементы слоя друг с другом, максимальный в начале процесса, постепенно уменьшается вследствие воздействия внешних по отношению к сети управляющих сигналов (при увеличивающейся проводимости связей). Достигнув минимального значения (равного расстоянию между двумя соседними нейроподобными элементами), радиус действия ближних связей начинает постепенно возрастать. Медленная пульсация длины ближних связей продолжается в течение всего процесса. Сочетание описанных выше входных воздействий с пульсацией радиуса действия ближних связей приводит к тому, что в результате роста выходных потенциалов нейроподобных элементов слоя ближних связей рельеф активности в каждой области слоя приобретает конусообразный вид, причем проекция вершины каждого конуса находится в близкой окрестности центра, вписанного в область квадрата максимально возможного размера. Пусть [ϰ1i,j] — исходная рецепторная матрица, т. е. матрица, в которой первоначальные области зафиксированы в виде единичных значений соответствующих двоичных элементов, а все остальные элементы матрицы — нули. В ходе реализации алгоритма рецепторная матрица периодически изменяется в результате выполнения описанного в параграфе 6.2 набора операций с двоичными матрицами. Для различения последовательности циклов этих матричных операций вводится индекс k, который пишется справа сверху от буквы, обозначающей матрицу. Тогда после k-го цикла матричных операций обозначение рецепторной матрицы примет вид [ϰki,j]. Согласно описанию структуры нейроподобной сети, приведённому выше, в любой момент времени t суммарное воздействие на входе i, j-го-нейроподобного элемента слоя с ближними связями определяется по формуле Как и в параграфе 6.1, для численного решения системы из p × m уравнений (6.28) вводится тактированное машинное время t. Из уравнения (6.28) получаем Подстановка (6.29) в (6.30) приводит к формуле, по которой ЭВМ осуществляет последовательный пересчёт выходных потенциалов нейроподобных элементов слоя (элементов матрицы [Pti,j]): Напомним, что в процессе счёта сети величина n периодически изменяется в пределах от 3 до nmах = 31. В случае различающихся по площади и по форме исходных областей конусообразные образования рельефа активности слоя, возрастающие в процессе пересчёта сети, в любой момент времени существенно отличаются друг от друга по высоте. Задача заключается в том, чтобы параллельным алгоритмом определить координаты их вершин. Для этого на каждом такте пересчёта сети выходные потенциалы нейроподобных элементов слоя сравниваются с постоянным порогом — L. Как только хоть один элемент матрицы [Pti,j] достигает величины L, в соответствующем элементе дополнительной двоичной матрицы [ati,j] производится изменение нулевого значения на единичное в
[позже текст будет дополнен до конца параграфа] |