РЕЦЕПТЫ БИХЕВИОРИЗМА ДЛЯ ИСКУССТВЕННОГО РАЗУМА

16-11-2013

;Настоящая статья посвящена проблеме разработки системы искусственного интеллекта.  Согласно существующим научным взглядам эта задача помимо решения чисто научно-технических вопросов также сталкивается с философской проблемой взаимоотношения человека и системы данного типа.  Данная проблема разделяется на два аспекта:  что следует считать искусственным разумом, и как построить систему тестов, позволяющих определить искомое качество в указанной системе.  За последние десятилетия в компьютерной технике произошёл столь значительный прогресс в моделировании многих функций человеческого интеллекта, что мы, несомненно, можем оценивать существующую ситуацию как граничную и считать насущной задачей разработку конвенциональных теоретических предпосылок и практических научных подходов в данной области.

Согласно  классическим представлениям У. Эшби от машины можно получить столько разума, сколько мы хотим: разумная деятельность это - умение совершать необходимый отбор. Такой взгляд указывает на рациональный характер разумного поведения.  Начиная от простейших регуляторов уровня жидкости или давления пара в котлах, и заканчивая машинами, играющими в шахматы, пишущими стихи или музыку, или говорящими на множестве языков, их рациональное поведение оказывается несомненным, но они всё же остаются не более, чем продуктом, а не носителем интеллекта.  Какими качествами должна обладать искусственная система, чтобы она, обеспечивая, например, функционирование некоего гомеостаза, типа «агент интеллекта» (термин, принятый в научном сообществе в последнее время), при управлении столь сложным динамическим объектом, если и не станет вполне разумной, то хотя бы обретёт некоторые личностные признаки?  Многие авторы, такие, как Тьюринг, Ньюэл, Саймон, Уонг, Черняк и МакДермотт, Чалкофф и многие другие, несмотря на расхождения в оценках того, что следует признавать основным - процесс мышления, оценки в сфере поведения, копирование поведения человека или просто рациональное поведение, - тем не менее, сходятся в основном, - система должна мыслить и/или действовать подобно человеку.  О том, насколько реалистично представление о возможном сходстве мыслящей системы с человеком во всём пространстве разумности, мы вернёмся позже, но, исходя из указанной парадигмы, мы можем обратиться к тем функциональным характеристикам, которые лежат в основе человеческой деятельности.  Бесчисленное множество функций, целесообразность и точность их выполнения это - то, что позволяет человеку существовать и выживать как индивидууму, сохраняя при этом интересы популяции.  В случае принятия функциональной аналогии в качестве критерия разумности, сходство поведения во всём функциональном континууме при любой, даже  весьма невысокой степени сходства не может быть представлено при помощи сравнительного теста, поскольку таковой должен был бы содержать бесчисленное количество испытаний.  Тем более нереальной должна представляться перспектива структурного подхода, т.е. копирование топографии и детальной структуры мозга на машинном субстрате.  Однако,  если, допустим, тем не менее, обретёт реальное содержание план добиться сходства деятельности агента интеллекта с поведением животных высшей организации, то в этом случае также будет необходимо отказаться от выполнения никогда не завершаемого теста на функциональную идентичность и искать это сходство именно в сфере поведения.   При этом потребуется воссоздать некоторые «базовые» алгоритмы, выполнение которых в условиях вариаций относительно небольшого разнообразия начальных состояний сможет указывать на персонифицированный, или, насколько это возможно, квази-разумный характер поведения.  Совокупность качественных характеристик поведения высших представителей животного мира указывают на их принадлежность к особому классу живых существ, функционирование которых включают механизмы идеального психического отражения, развитые на основе как генетической, так и опытной информации.

С усложнением уровня развития видов выживание отдельных особей и
информация опыта приобретают всё большую значимость. Это, прежде всего, относится к периоду начального воспитания молодых особей. Это - время, когда мозг животного готовится к дальнейшей переработке важной информации, которая впоследствии во многих случаях будет играть жизненно важную роль.
(По аналогии с компьютером отмеченный факт оказывается сходным с загрузкой операционной системы).

По мере перехода от простых к более развитым видам представителей фауны системная характеристика их поведения, целенаправленность которого представляет их общий определитель, включает следующие особенности.

  • Реализация алгоритмов управления различной сложности при взаимодействии со средой обитания и изменении условий среды в определённых пределах.  Способность к информационному отражению.
  • Способность применять заданную классификацию задач управления, выбирать цели и алгоритмы поведения соответственно действию на уровне безусловных рефлексов.  Целенаправленный акт в переменных условиях ареала обитания.
  • Способность к разработке собственных алгоритмов поведения (на пути от случайного к направленному поиску) для реализации целей, отвечающих заданной генетической программе. Накопление и распознавание информации опыта. Адаптация, возникновение условных рефлексов. Автономное поведение (индетерминизм). Самостоятельный целенаправленный акт в поведении.
  • Способность к формированию и выбору конкретных целей на основе органических потребностей и глобальных целей поведения с использованием критериальных методов оценки их эффективности.  Структурная и функциональная  самоорганизация.  Самостоятельная коррекция критериев оптимального поведения на основе инстинкта самосохранения, индивидуального и видового опыта.  Самостоятельное целеполагание.  Волевой акт в поведении.
  • Отдельные признаки, характерные для психики высокоорганизованных животных, которые с развитием технологии в данной области будут допускать моделирование на машинном субстрате.

Мы усматриваем направление разработки алгоритмов агента интеллекта в виде двух основных этапов.

I

Несмотря на всю сложность поведения наиболее развитых животных , таких как птицы или млекопитающие, можем ли мы считать их поведение разумным?  Компетентный ответ отрицателен.  Биология этих животных такова, что если они и проявляют некоторые рудименты второй сигнальной системы, то семантический состав передаваемой ими информации не превосходит их элементарных потребностей и почти начисто лишён абстрактного содержания.  Краеугольным отличием по типу мышления животных от человека также является отсутствие самосознания.  (Здесь можно отметить, что самосознание у человека тоже появляется не сразу, но обычно не раньше, чем на 2-м 3-м году жизни.)  Однако, некоторые типы поведения характерны для всей группы высокоразвитых существ, включая человека.  Локализация этих типов, и разработка соответствующих алгоритмов как раз и могли бы представить первый этап создания искусственного интеллекта.  Наиболее общей бихевиористской характеристикой живых организмов является их целенаправленное поведение.  Даже на уровне простейшей жизни, например в форме вирусов, мы можем зафиксировать протекание физико-химических процессов, а в терминах биологии - процессов ассимиляции, диссимиляции и размножения в строгом соответствии с программой генетического кода.  Простейшие представители фауны, наделённые поисковой активностью, с точки зрения действия их систем управления функционально отличаются незначительно.  Они  обладают способностью перемещения своего организма в питательной среде случайным образом, или путём отработки некоторых запрограммированных предпочтений, активизированных по результату физико-химического анализа среды.  Функциональным аналогом простейших организмов, если иметь в виду механизм переработки информации в мире машин, являются обычные автоматические регуляторы, оперативные и навигационные компьютерные системы автомобилей и самолётов, различного типа роботы.

Наиболее важным признаком системы управления биологического организма является отработка первоочередной целевой функции - обеспечения этого организма энергией, т.е. пищей.  Это обусловливает целенаправленный акт в поведении.  Приоритеты различных целей поведения в многообразных условиях среды для простых организмов должны быть генетически табулированы.  Следует отметить, что даже на низших ступенях развития могут присутствовать алгоритмы самообучения, т.е. программная коррекция поведения в соответствии с результатами анализа окружающей обстановки и собственных реакций для установленных целей функционирования.  Самостоятельный целенаправленный акт, включающий отбор и реализацию целей, является конкретным качественным признаком системы такого рода в поведении и является необходимым условием для развития способности к созданию собственных эффективных алгоритмов и возникновения условного рефлекса в живом организме.

Здесь требуется привлечение механизма оперативной и долговременной памяти, а также критериальных оценок эффективности поведения, т.е. элементы анализа качества собственных действий.  Техническим аналогом такого рода деятельности может служить самонастройка параметров или алгоритмов различной сложности обычных регуляторов и регуляторов с переменной структурой.  В биологии простейших сходные алгоритмы должны обеспечивать,к примеру, контроль перемещения организма в среде с направленным потоком тепла или со значимым градиентом концентраций, температуры или давления.  Создание модели искусственного интеллекта должно происходить с учётом характерных изменений на пути усложнения биологических систем.

Существенно то, что высокоразвитые животные, начиная от низших форм, и захватывая все высшие формы, включая человека, при развитии способности к самообучению от уровня условного рефлекса и выше обретают способность к самостоятельному целеполаганию, а именно к развитию и выбору целей поведения, обеспечивающих функционирование организма как гомеостаза.  Такой организм представляет собой сложную динамическую систему, способную к самостабилизации в условиях непредсказуемых комбинаций внешних воздействий.  При рассмотрении биосистем по нарастанию степени их организации мы обнаруживаем усложнение и специализацию тканей, органов и биологических функций живых организмов.  Появляется существенный и сепаратный мотив поведения - биологическая потребность.  Актуализация и приоритезация потребностей и их комбинаций приводит к самостоятельному формированию и выбору целей поведения.  Естественно, что помимо физических потребностей, требующих немедленной реализации, существуют глобальные цели поведения, продиктованные принципами сохранения вида и самосохранения .  Реализация простейших потребностей организма не требует особо сложных алгоритмов и осуществляется при отработке целей низшей иерархии.

Моделирование такого типа поведения осуществляется регулярно в современных компьютерах, в частности, при выполнении программ их автоматического самообслуживания (примером может служить самокоррекция операционной системы компьютера).  Если окажется возможным воспроизвести на компьютере аналог комплексного инстинкта самосохранения, то информационные процессы, реализующие соответствующие алгоритмы  в машине и в биологическом организме, могут оказаться похожими достаточно для того, чтобы затем пытаться находить пути для совершенствования этой машины и дальнейших поисков при конструировании всё более продвинутых версий.  Инстинкт самосохранения, а также инстинкты, связанные с развитием позитивной динамики популяции (половой инстинкт, инстинкт защиты своей семьи, своего ареала, гнезда, логова, инстинкты агрессии во внутривидовой и межвидовой борьбе, одобрительные или блокирующие реакции, подкреплённые условными рефлексами, и т.д.) лежат в основе формирования глобальных целей поведения, которые актуализуются в результате их дробления на локальные цели низшего уровня.

Эти цели вырабатываются и принимаются каждой отдельной особью путём самостоятельного целеполагания и реализации природной свободы воли.  Реальное поведение подчиняется чередованию простейших конкретных целей, приводящих в действие всевозможные эффекторы организма, начиная от безусловных реакций, типа секреторной деятельности при усвоении пищи, и заканчивая сложными динамическими комбинациями работы скелета, мышц и органов чувств, требуемых для реализации принятых целей.  При выборе конкретной цели поведения организм выполняет задачу выделения этой цели (или комбинации согласованных целей) и назначения для неё высшего приоритета.  Важнейшим критерием отбора  (исключая принципы работы организма на рефлекторном уровне) является механизм разрешения, построенный на получении боли и удовольствия и соответствующем прогнозе указанных ощущений.  Весь набор инстинктов и критериальных оценок при этом работают так, что в совокупности их действие предопределяет стабильное существование как отдельной особи, так и популяции в целом.  Таким образом, первый этап на пути моделирования  искусственного интеллекта должен включать реализацию глобальной цели поведения и её локальных фрагментов с применением системы поощрений и наказаний (удовольствия и боли в животном мире).  Решение этой задачи отвечает идее создания на машинном субстрате логического аналога циркуляции информации управления живым организмом.

На сегодня во многих компьютерных кластерах, действующих по принципу психологического выбора на основе методов, сходных по смыслу с системой поощрений и наказаний, достаточно успешно осуществляется распознавание качественной (зрительной, акустической) информации по входным каналам, эквивалентным органам чувств.   Так, например, возвращаясь к идее Перцептрона Фрэнка Розенблата и сетей Алана Тьюринга, с  использованием коррекции психологического типа, т.е.дрессировки, воспитывают популярную собаку-робота Aibo, которая в 1998 году была разработана Sony, и с тех пор её различные модификации участвуют в исследованиях взаимодействия человек-робот.   В компьютерных программах Гетеборгского университета, стимулируя извне  «психологический» выбор, при отборе предпочтений прогнозирования незаконченных числовых последовательностей, доктору К. Страннегарду  удавалось повысить IQ системы до 130 (http://www.flov.gu.se/english/contact/staff/claes-strannegard/), тогда как средняя величина IQ человека, как известно, равна 100.  Следует отметить, что во всех случаях успешного решения задач распознавания образов и прочих задач, когда система обладает способностью к самоорганизации, действуя по принципу модификации (усиления/ослабления) связей нейроноподобных элементов, носителем функции цели является человек.

Значительный опыт накоплен при создании различного типа индустриальных адаптивных систем.  Компьютерные программы, включающие алгоритмы самообучения и самоорганизации, установлены и успешно работают во многих автоматизированных системах управления.  Во всех подобных случаях адаптация системы и различные поисковые режимы осуществляется в соответствии  со статическим критерием оптимальности (максимальная эффективность системы в условиях заданных ограничений на многомерный ансамбль управляющих воздействий.  В индустриальных системах это, как правило, - максимальный доход предприятия).  Такая система выполняет задачу поиска максимально (или минимально) возможных допустимых значений целевой функции,  и отклонения (потери поиска) от искомого экстремума в силу статического характера этой функции обусловлены обычно динамическими свойствами системы.  Исключение может составлять целевая функция, имеющая несколько экстремумов, но и в этом случае имеются алгоритмы нахождения особых типов экстремума, таких как максимум-максиморум.  Нахождение экстремума статической целевой функции, учитывая то, что положение экстремума под действием возмущающих воздействий, как правило, изменяется во времени, является задачей компьютерной оптимизации, как статической, так и динамической.  Динамическую оптимизацию обычно связывают с нахождением оптимальной траектории изменения определяющих параметров системы во времени, а в социальных сетях и в иных динамических поисковых системах функция цели это - быстрое и правильное нахождение конкретного задания.  Во всех указанных случаях эффективность системы назначается или подтверждается человеком и в этом смысле система, даже учитывая её способность к обучению, вплоть до возникновения механического аналога условных рефлексов, тем не менее, остаётся на уровне выполнения конкретных предписаний и не обладает способностью самостоятельного целеполагания.

Мы усматриваем возможность специфического подхода для разработки алгоритма искусственного самостоятельного целеполагания, т.е. алгоритма адаптации агента интеллекта, использующего аналог системы поощрений и наказаний.  Система управления неким гомеостазом указанного типа должна быть построена так, что она окажется в состоянии находить стратегию поиска, при которой необходимые тактические девиации, обусловленные текущими требованиями динамики системы, будут отвечать некоторому динамическому критерию качества . то есть решать определённую задачу динамической оптимизации.  В процессе поиска искомого качества эта задача должна разрешаться в пределах допустимых отклонений.  Примером может служить гомеостаз, управляемый в условиях  противоречивых требований (а) эффективности управления в отношении базовой функции цели (б) стабильности гомеостаза.

Можно предвидеть, что в силу особых свойств системы, связанных с её динамическими характеристиками и прочими признаками, такими как нагрузки, нелинейности и пр. на каналах управления, требования её стабильности в виде заданных ограничений на управления будут относиться к такой постановке задачи, которая может оказаться  недостаточно эффективной.  Поэтому при формулировке критерия оптимальности более продуктивным может оказаться иной подход, чем при решении стандартных задач оптимизации с ограничениями.  Здесь представляется практичным представление о действии двух или более конкурентных целевых функций глобального типа, отвечающих потребностям  различных частей системы, и образующих одну общую целевую функцию.  Такая система будет выполнять задачу самостоятельного целеполагания, а также за счёт изменений её установочных позиций и общей структуры действовать на локальном уровне.  Указанные свойства позволят сделать эту систему в значительной степени персонализованной,  т.е. автономной по отношению к человеку, его оценкам и установкам.

В качестве простого примера создания подобной системы мы предлагаем рассмотреть следующий алгоритм.

Инстинкт самосохранения живым организмом направлен, прежде всего, на реализацию его главной потребности - в пропитании.  Надлежащий энергетический потенциал обуславливает успешность организма в сложных условиях постоянной борьбы за выживание. Для создания алгоритма, моделирующего поведение этого организма,следует обратить внимание на такой факт, что механизмы ассимиляции всех видов животных и, в частности,млекопитающих обеспечивают развитие в организме резервных запасов продовольствия, ответственных за энергетическое обеспечение их разнообразных потребностей.  На экспериментальном компьютере, -  назовём его Кот Шредингера 1 (КШ1) (это название отражает идею мысленного эксперимента Эрвина Шредингера, при котором нашла своё иное воплощение идея чёрного ящика, -  его воображаемого кота следовало считать одновременно и живым и мёртвым до тех пор, пока экспериментатор не убеждался в том, что он жив) - в качестве основной целевой функции С1 следует условно принять максимизацию заряда батареи питания до некоторого оптимального уровня, соответствующего требованию стабильности данного гомеостаза.

Величина заряда этой батареи должна представлять аналог общего энергетического потенциала высокоорганизованного животного.
В реальной электрической схеме лучше использовать конденсатор большой ёмкости С. Однако, для упрощения презентации предпочтительно оперировать понятием заряд Q, а не разность потенциалов V. Здесь следует учесть, что Q=CV

Скорость изменения заряда должна учитываться  подобно работе системы поощрений и наказаний (т.е. удовольствия и боли у животного, или его умиротворения и расстройства.).    Так можно построить некоторый гомеостаз, суммарная потребность в энергии которого обеспечивается подсоединённым к нему источником питания. Вариации потока энергии на входе будут представлять интегрированный вектор возмущающих воздействий, включающий, во-первых, аналог изменений качества инструментального состояния системы и, во-вторых, изменения состояния внешней среды.  Второй фактор представляет аналог того, что в английском языке в отношении живого контингента называется “God’s Will”, а для данного компьютера представляет канал воздействия человека на систему и является опорным элементом при балансировании между подачей и расходом энергии.  Помимо постоянно действующего канала поступления энергии в секторе с1 предусматривается также отдельный разветвлённый канал  нагрузки, находящийся в секторе с2. Батарея подключена к системе в точке соединения обоих каналов и находится в зарядно-разрядном режиме в зависимости от общей динамики гомеостаза.  Стабильность системы обусловлена установкой суммарного потока энергии на канале нагрузки на некотором заданном уровне, который поддерживается при помощи управляющего воздействия на источник питания. На каждой из ветвей канала нагрузки  располагаются основные регулирующие органы системы управления КШ1.  Актуальный совокупный поток энергии, проходящий по этим ветвям, соответствует потребности системы в том расходе энергии, который необходим для стабильного состояния гомеостаза.

Энергетические затраты, соответствующие нагрузкам на каждой из ветвей, являются аналогами затрат на поддержание состояния собственного здоровья моделируемой особи и её физиологических потребностей, на формирование и защиту её семьи и ареала, превалирующего положения внутри и за пределами популяции и т.д.  Перечисленные условия взаимосвязаны, подвержены мощным возмущающим воздействиям, обладают различными динамическими свойствами, могут изменяться с приближением каждого из них к границам возможного коллапса гомеостаза, и имеют определённые веса при образовании суммарного потока. Динамические свойства нагрузок должны прогнозироваться в секторе с2  на основе математических моделей каждой из ветвей расхода энергии. Управляющие воздействия на этих ветвях, представляющие регулируемые изменения нагрузок, поддерживают расходы энергии, необходимые для компенсации локальных возмущающих воздействий, имеющих по отношению к системе управления случайный характер.  При этом система управления должна поддерживать баланс между заданной величиной потока энергии на канале нагрузки и суммарным расходным потоком на выходе гомеостаза.  В оптимальном режиме при появлении на одной из ветвей наиболее опасного возмущающего воздействия энергетическая компенсация этого воздействия происходит за счет пропорционального подъёма установившихся управляемых  величин степени риска и соответствующего уменьшения потоков энергии (уровней безопасности) на всех ветвях канала нагрузок. Таким образом, постоянно будет происходить перераспределение расходных потоков энергии.

Управляющие воздействия работают с запаздыванием и инерцией, характерными для каждой ветви.  Это приводит к динамическому рассогласованию между заданной и актуальной величинами расхода энергии на канале нагрузки и к соответствующему снижению величины заряда батареи от оптимального уровня, который рассчитывается системой в соответствии с принятым критерием оптимальности. (Перед выходом в рабочий режим степень риска на канале нагрузок также выставляется на заданное значение и она должна соответствовать средним позициям регулирующих органов.)

Снижение заряда до момента возврата к оптимальному режиму добавляет определённый инкремент к упомянутому нарушению динамического баланса энергии.  В рабочем режиме, отвечая глобальной цели поведения, оптимальное значение заряда батареи  должно будет нарастать.  Этот фактор представляет собой добавочный инкремент к рассогласованию подвода и потребления энергии и, таким образом, повышает степень риска при функционировании гомеостаза.  Появление регулярно возникающих больших возмущений в один из моментов приведёт к критическому снижению уровня безопасности на одной или нескольких ветвях расхода энергии.  В данный момент временно должна поменяться структура системы, переведя её в защитный режим.  При этом управления на всех ветвях канала нагрузки, кроме тех, которые инициировали защитный режим, должны принять фиксированное текущее положение, а оптимальное значение заряда батареи должно начать снижаться сначала быстро, затем медленно, но с нарастанием скорости так, чтобы сначала на аварийной ветви, а затем на всех остальных ветвях, их уровни безопасности поднялись, как минимум, до установочного уровня.  После этого система должна будет возвратиться в рабочий режим. В новом рабочем состоянии гомеостаз заново окажется в состоянии с более высоким уровнем стабильности.

В изложенном описании алгоритма схематично представлены его основные рабочие свойства.  Приведённая в приложении структурная схема показывает взаимодействие отдельных блоков КШ1 и предназначена для иллюстрации указанных функций в соответствии с критерием оптимальности.  Возможно, что с освоением предложенной нами техники оптимизации в системе управления КШ1 откроются пути для её дальнейших модификаций.  Необходимо учесть, что в случае совершенствования гомеостаза в ходе попыток создания более достоверного сходства КШ1 с реальным представителем животного мира, потоки перерабатываемой информации будут значительно шире, чем в системе, реализующей описанный алгоритм.  Существенным элементом реализации данного алгоритма является формулировка критерия оптимальности.

При нарастании заряда батареи Q для защиты от коллапса системы можно ввести  ещё одну целевую функцию С2, которая будет действовать в оппозиции к целевой функции С1, реализуя требование максимальной стабильности гомеостаза КШ1 и, таким образом, ограничивать заряд батареи, находя некоторое его оптимальное значение.  Критерий оптимальности можно сформулировать при этом как некоторую экстремальную динамическую функцию управлений, реализация которой будет представлять качество  работы всей системы управления гомеостазом.  Экстремум данной функции образуется в результате нарастания заряда батареи, т.е. энергетического потенциала системы с одновременным понижением расхода энергии до момента, пока степень риска дестабилизации системы становится неприемлемо высокой.  Степень риска, установленная в секторе с2 является тем фактором, который предопределяет затраты энергии на поддержание стабильного состояния системы.  Но, как об этом говорилось выше, фиксированное ограничение целевой функции С1 не обеспечит желаемой эффективности управления.  Нужное ограничение может быть введено в критерий оптимальности в качестве негативной аналоговой функции роста, к примеру - некоторого компонента экспоненциального типа, представляющего целевую функцию С2.  Упрощённо указанный критерий можно представить в виде следующей функции:

Max {C1 - C2}= Max{ Q(t) - e k  Q(t) }.

Здесь Q(t) = ∫ [ X(t) – Y(t)] dt – динамический уровень заряда батареи в нормированном виде,

X(t) – ток заряда батареи;

Y(t) -  ток разряда батареи;

sq_root1            где u1, u 2, u 3,… потоки энергии (представляющие функции регулируемых нагрузок на канале управления с учётом их весов) на отдельных ветвях канала нагрузок;

k -  коэффициент положения экстремума.

Функция С1 – С2 – экстремальна в зависимости от Q.  Так, например, при k =1/( e -1)

С1 – С2 = -1 при двух значениях Q:  Q1 = 0 и Q2 = е - 1, что означает наличие максимума в пределах изменения Q от Q1 до Q2.

При формулировке критерия оптимальности учитывалась конкретная специфика агента интеллекта.  Если в будущем произойдёт существенное расширение его функциональных возможностей, и он будет оперировать значительными массивами информации, то всё же, тем не менее, он не будет иметь информации о степени риска,  удовлетворительной для обеспечения стабильности гомеостаза, и следовательно пригодной для применения в качестве ограничения целевой функции С1.  Выполнение требования целевой функции С2 при поиске оптимального режима сопряжено с ослаблением действия целевой функции С1 по аналогии с действиями биологической особи в соответствии с такой модификацией поведения, которая могла бы отражать опыт её выживания и обучения, или существовать на генетическом уровне.  Здесь будет играть роль эффективность адаптации, - как самообучения системы, так и её самоорганизации при выборе наиболее подходящей структуры и возникших при этом или уже имеющихся алгоритмов управления.  Применение целевой функции С2   удовлетворяет противоречивым требованиям - она допускает полный диапазон заряда батареи, и при этом позволяет соблюдать ограничивающие условия стабильности.  Анализ информации о состоянии системы, собранной на её выходе, с использованием данных о процессе на входе системы позволит  находить прогностические результаты для управляющих воздействий с учётом соответствующих вероятностных оценок.  Оптимальные решения должны собираться системой в качестве постоянно обновляемой базы данных (по аналогии со сбором информации опыта, участвующей в рефлекторной деятельности организма и в реализации его способности предвидеть результат собственных действий). С использованием результатов данного вида деятельности, внутри системы должна осуществляться коррекция критерия оптимальности.  Важным инструментом коррекции может служить база экспоненты С2.  Следует учитывать, что в пределах требований стабильности гомеостаза оптимальное значение целевой функции согласно критерию оптимальности должно увеличиваться. Изменяя коэффициент “k” ограничительной целевой функции С2 можно менять положение экстремума критериальной целевой функции. (Первоначальное значение этого коэффициента предполагается заданным).    Положение экстремума определяется из условия:

d(C1-C2)/dQ = O

Отсюда можно получить оптимальное значение заряда батареи:

Q0= - Ln k / k .

Из этой формулы видно, что при уменьшении k и с приближением его к нулю, Q0 неограниченно растёт и быстро превосходит физический предел заряда батареи.  Поэтому при увеличении заряда уменьшение k должно происходить с его асимптотическим приближением к некоторому заданному значению, которое отвечает определённой  величине заряда, существенно отстоящего от его максимально возможной величины.  Неполный заряд и уменьшение скорости зарядки вообще отвечают идее насыщения животного пищей и должны существовать, как одно из предписаний алгоритма, подлежащих коррекции по данным исследования интенсивности и характера возмущений.  Необходимость уменьшения Q0 за счёт увеличения k в защитном режиме приводит к похожей ситуации.  Изменения k ограничены сверху физическим пределом  k < 1, поскольку при  k > 1  Q0 становится отрицательным.  Это означает, что при уменьшении зарядабатареи меньше некоторой величины дальнейшее уменьшение Q0 должно происходить с асимптотическим приближением k к 1,т.е. не по линейному закону, а, допустим, по гиперболическому.

Динамические отклонения при любых методах управления могут оказаться недопустимо большими, а в жизни живого субъекта - фатальными. . Падение заряда до недопустимого уровня за счёт динамических флуктуаций системы  угрожает коллапсом гомеостаза и требует перехода системы в аварийный режим.  При этом необходимо переформулировать критерий оптимальности и перейти к выполнению целевой функции С2 с ограничением по заданной минимальной величине С1, поскольку последняя  должна не обратиться в “0”, т.е. не снизиться до окончательного истощения ресурса батареи.   В защитном и аварийном режимах уровень иерархии целей может снижаться, переходя к формированию целей управления отдельными ветвями на канале управления и обеспечивая необходимые девиации на проблемном сегменте.

В случае регулярного нарастания динамических нагрузок на различных ветвях управления до некоторых критических величин в секторе с2, система должна вырабатывать серию различных планов для ликвидации угроз с соответствующим прогнозом необходимых затрат энергии.  Согласно принятому плану в реальном времени должны осуществляться расчёт и отработка управляющих воздействий, - в частности варьирование скорости нарастания заряда батареи, возможное прекращение нарастания заряда или временный реверс в сторону разряда, и, наконец, ликвидация угрозы на той ветви, где требуется разрешение проблемной ситуации.

Иногда шум среды превосходит возможности его компенсации в системе управления, или, как это случается в практике автоматической оптимизации, возмущения, а также инерция системы, оказываются столь велики, что динамические отклонения самой системы управления делают её функционирование невозможным.  В этих случаях по результату анализа возмущений гомеостаз должен перейти в аварийный режим консервации и блокировать активность системы управления, оставляя наиболее выгодные величины управлений в статическом состоянии.  Все указанные манипуляции связаны с изменением структуры системы не за счёт заданных извне предписаний.  Устойчивое функционирование описанного гомеостаза должно свидетельствовать об успешной самоорганизации системы управления, в которой применяется самостоятельная постановка целей управления и соответствующая модификация её структуры, то есть в этом случае можно будет считать успешным первый шаг в искусственной реализации принципа самостоятельного целеполагания.

Из приведённого анализа критерия оптимальности видно, что оптимальное значение общей целевой функции Q0 однозначно связано с управляемым коэффициентом положения экстремума k.  Это означает, что для рассмотренного нами простейшего случая оптимизации гомеостаза при поиске оптимального значения Q0 нет необходимости осуществлять управление при помощи вариаций k.  Достаточно привести оптимальное управление непосредственно к Qи требование оптимальности при этом будет достигнуто с тем же ожидаемым эффектом.  Иначе будет обстоять ситуация, когда мы захотим корректировать оптимальный режим по результатам истории функционирования гомеостаза или приблизиться к моделированию реальной психологии животного, поведение которого не является продуктом расчёта оптимальных решений.  Предложенный критерий оптимальности предусматривает канал как управляемых, так и несистемных внешних воздействий, с последующей их коррекцией.  База экспоненты допускает внешние вариации, и если этот фактор будет задействован, то оптимизация гомеостаза будет возможна только за счёт модуляции величины k, и при этом соответствие между оптимальным решением и управлением k уже не будет однозначным.  Следует ожидать, что поиск оптимального режима с учетом использования указанного фактора в качестве дополнительного воздействия (например, по результатам статистики блокирования рабочего режима) сможет подтвердить конформность и преимущество экспоненциальной ограничительной функции, хотя при формулировке критерия оптимальности для этой цели возможно применение иных функций роста.  Также с учетом того, что метод моделирования психологии оригинала может включать различные подходы, по предложенному стандарту возможна формулировка критерия оптимальности в следующем виде:

Max {C1 - C2 – C3 + C4 - ....}.

При этом может заметно усложниться задача автоматической оптимизации и потребуется  применение сложных поисковых алгоритмов.  Тем не менее, построение критерия оптимальности в заданной конфигурации обеспечит реальную возможность формализации постановки задачи.

Детальная разработка алгоритмов, типа описанного выше, не должна составлять значительных трудностей на современном уровне техники с учётом опыта создания достаточно сложных алгоритмов для реализации множества стратегических игр.  Можно представить, что построение таких алгоритмов  будет осуществляться в нескольких версиях и реализовываться на нескольких машинах, объединённых в сетевую систему обмена информацией.  Информационные сети на сегодня достаточно развиты для того, чтобы при взаимодействии отдельных машин можно было обеспечить такой состав передаваемой информации, при котором было бы возможно создать общую базу данных, значительно повысить при этом качество систем управления и добиться того, что данная информация станет выполнять некоторые функции по аналогии с действием 2-й сигнальной системы среди живых организмов.

Преимуществом предложенного алгоритма является то, что он открывает путь для дальнейшего приближения к психологии живого существа.  Применение математических моделей на отдельных ветвях канала нагрузки, включая исследование корреляционных функций и спектров возмущений, может позволить прогнозировать события на соответствующих участках и принимать решения по корректировке как текущего оптимального энергетического состояния агента интеллекта, так и конкретных управлений, включая степень риска или уровни безопасности на отдельных управляемых сегментах.  Это поможет осуществить подход к более надёжному моделированию психологии животного, действующего с учётом эмоциональных мотивировок. Система управления должна будет иметь возможность поиска оптимального состояния методом проб и ошибок по аналогии с реальным взаимодействием со средой живого организма, активно использовать возможности долговременной памяти при создании механических условных рефлексов, использовать достижения в области распознавания образов, создавать общую картину окружающей среды с использованием виртуального исследования математических моделей системы.  Последнее представляет собой аналог сканирования той модели мира, которую высокоорганизованные организмы формируют в своей памяти на основе  индивидуального опыта и используют эту модель в форме идеального психического отражения всех процессов своего взаимодействия со средой.

 II

Философскую позицию бихевиоризма легко представить, воспользовавшись кратким тезисом У.Эшби, - разумен тот, кто разумно действует.  Для описания качественной специфики сознательного процесса необходимо «научиться в терминах поведения осуществлять объективное описание самого механизма, это поведение обуславливающего, уметь отличать отдельные виды деятельности высокоорганизованной системы» (А.Н. Колмогоров).  Если для распознавания квалификационных признаков указанного механизма необходимо обозначить качественные характеристики интеллектуальной деятельности, то в соответствии с философией бихевиоризма определение их в сфере поведения – условие достаточное.

Философские аспекты проблемы искусственного разума включают множество иных проблем, требующих отдельного обсуждения.  Среди них можно указать на проблему наличия или отсутствия принципиальных ограничений для создания разумной машины, проблему детерминизма/индетерминизма волевого поведения, проблему адекватности моделей сложных динамических систем и определения степени разумности машины в терминах бихевиоризма, проблему качественных определений в иерархии управляемых систем и т.д.  Дальнейшее развитие темы  искусственного интеллекта с использованием алгоритмов самостоятельного целеполагания непосредственно связано с качественными оценками в сфере поведения индивидуального и группового биологического гомеостаза.  Можно представить, что указанное развитие будет происходить при создании различного типа роботов.  Превосходство человека в иерархии биологических видов естественно связано с качественным функциональным своеобразием человеческого мозга.  Специфика этого своеобразия заключается в способности человека к абстрактному мышлению, в формировании понятий, суждений, умозаключений, в наличии 2й сигнальной системы, включающей возможность передачи информации абстрактного характера, в наличии самосознания. Если говорить о создании машины, наделённой разумом, т.е. машины, в которой могло бы возникнуть самосознание, тогда следует учесть тот факт, что самосознание означает выделение себя не только из окружающей среды, но также и из среды себе подобных, в которой могло бы сформироваться понятие «Я».  Не исключено, что сложные функции в некоторых сферах человеческой деятельности должны будут выполнять коллективы роботов, которые будут общаться между собой, создавать и разрешать проблемные ситуации.  Даже в этих условиях, с высокой степенью развития человекоподобного поведения роботов и их интеллектуальности, с использованием в их системах управления идеальных образов, эвристических методов для разрешения сложных задач и полной автономности принятия решений, нельзя с уверенностью утверждать, что в обозримом будущем это приведёт к спонтанному развитию самосознания.

Как мы обсуждали выше, сходство деятельности агента интеллекта с поведением человека рассматривается как исходный пункт развития любого типа работ в направлении создания машин, наделённых сознанием.  Человекоподобие предполагает также способность роботов к размножению, т.е. к самовоспроизводству популяции. Инстинкт самосохранения является краеугольным для любого представителя фауны, для любой популяции, включая человеческую (представлять сознательное существо, лишённое такого инстинкта- несомненный абсурд). В случае, если бы создание подобных систем оказалось возможным, человечеству пришлось бы столкнуться с возникновением конкурентной популяции,  интересы самосохранения которой легко могли бы оказаться в конфликте с интересами человека.   При этом закономерно возникает ряд вопросов, - а нужно ли человеку, чтобы при всех прочих достоинствах роботы обрели самосознание и претендовали на права личности?  Насколько это безопасно ?  Какие идеи могут мотивировать финансирование разработки проектов данного типа?  Не будут ли всевозможные этические и законодательные ограничения препятствовать одобрению подобных проектов, наподобие запрета клонирования человека?  Можно ли вообще представить, что в обозримом будущем возникнут условия для возникновения проекта, направленного на развитие высшего типа интеллекта, наделённого сознанием?  Не следует ли считать более целесообразным и эффективным развитие возможностей человека для решения тех проблем, которые встанут перед нашей цивилизацией?  На все эти вопросы, исходя из практического опыта современности, ответов пока не существует.

 

ПРИЛОЖЕНИЕ

Блок – схема алгоритма КШ1

 17

B – батарея;

S -  источник питания;

X – входной поток энергии;   Y- поток энергии на канале нагрузки;

Q(t) – интегральный заряд батареи; Q0 – оптимальная величина заряда батареи;

С0 – оптимизатор;  С- регулятор;

k – управляющее воздействие автоматической оптимизации;

с1, с2 – входной и нагрузочный секторы гомеостаза.

Комментарии
  • Борис Коллендер - 17.11.2013 в 20:28:
    Всего комментариев: 343
    Эта статья уже появлялась в предыдущем номере Альманаха №690. Потом она исчезла. И я подумал, что автор (или редактор?) согласились с моим комментарием – человек вряд Показать продолжение
    Рейтинг комментария: Thumb up 0 Thumb down 0
    • ow@pisem.net - 21.11.2013 в 03:40:
      Всего комментариев: 953
      Странным образом автор упорно смешивает и применяет термины "разум" и "интеллект". Человеческий разум, безусловно , включает в себя и интеллектуальные способности, Показать продолжение
      Рейтинг комментария: Thumb up 0 Thumb down 0
    • OkaZigGR - 24.11.2013 в 04:07:
      Всего комментариев: 120
      Ваш тезис заключается в том, что Вы отказыветесь от общепринятого определения понятия "разумность", которое включает определённые признаки, отличающие "разумное" Показать продолжение
      Рейтинг комментария: Thumb up 0 Thumb down 0
      • ow@pisem.net - 26.11.2013 в 05:07:
        Всего комментариев: 953
        Отвечая уже не автору, а на комментарий OkaZigGR. Уважаемый OkaZigGR, надо внимательно читать тексты, прежде чем на них ссылаться! Уже во второй строчке моего комментария Показать продолжение
        Рейтинг комментария: Thumb up 0 Thumb down 0
        • OkaZigGr - 26.11.2013 в 20:29:
          Всего комментариев: 120
          На ow@pisem.net:, 26.11.2013 в 05:07: ______________________________________ Здесь, к сожалению, как я и предполагал, присутствует явная технический сбой. Мне, автору статьи, Ю.Кушниру, давно был Показать продолжение
          Рейтинг комментария: Thumb up 0 Thumb down 0
  • OkaZigGR - 24.11.2013 в 04:14:
    Всего комментариев: 120
    Предыдущий комментарий написал автор статьи, Ю.Кушнир в ответ на комментарии Борис Коллендер:, 17.11.2013 в 20:28: ow@pisem.net:, 21.11.2013 в 03:40:
    Рейтинг комментария: Thumb up 0 Thumb down 0
  • Boris Kollender - 26.11.2013 в 19:10:
    Всего комментариев: 343
    Господа! Представляйте ваши имена! А то можно подумать, что вы стесняетесь своих комментариев, скрываясь за непонятными адресами имайлов. Тем, кто обсуждает Показать продолжение
    Рейтинг комментария: Thumb up 0 Thumb down 0
  • ow@pisem.net - 03.12.2013 в 07:15:
    Всего комментариев: 953
    Владимир Славинский - логин: ow@pisem.net Проблема моделирования разума погибла в техническом сбое комментариев. Остаётся только ещё раз повторить Маяковского:"...Вещь Показать продолжение
    Рейтинг комментария: Thumb up 0 Thumb down 0

Добавить изображение