Виктор
Толстых
Искусственный
разум
Идея:
невозможно
создать
искусственный
разум для
изолированной
особи. Разум –
понятие
исключительно
социальное
и эволюционное. Если
говорить о
разуме и
пытаться
проводить
границу
между
разумным и
неразумным,
то эта
граница
выглядит расплывчато.
И
определяется,
главным
образом,
нашими
определениями.
Получается,
что
смоделировать
поведение даже
простого
животного –
есть
проблема. Т.е.
начинать
надо с
чего-то
простого. С
просто живого,
обладающего
свободой
воли. А что такое
свобода
воли, зачем
она нужна
организму?
Да вроде бы
ясно: для
обеспечения
выживания
себя и вида. Свобода
вполне
детерминированная
и сводится к
выбору
одного из
конкурирующих
вариантов в
каждый
опасный
момент.
Срабатывает
что-то типа
вычислительного
устройства
по краткосрочному
прогнозу
последствий
принятия
решения. Следует
ли из этого,
что всё-таки
можно разум
смоделировать?
Ведь
построить
систему принятия
оптимальных
решений не
кажется слишком
сложным. В
общем да..., но
чего-то
будет не
хватать.
Воспроизводства,
рождения и
смерти,
любви и
ненависти?
Адаптируемости
к любым
изменениям
окружающей
среды,
которые ни
одна
программа
предусмотреть
не в
состоянии? Во-первых,
живые
существа не
так уж
хорошо приспосабливаются.
Это
свойственно
более молодым
особям вида.
А потому в
критические
времена вид
обновляется
чаще. Т.е.
данное
свойство
более
присуще
виду. Во-вторых,
прочие
свойства,
присущие
живым существам,
опять-таки
присущи
виду: рождение,
смерть,
воспроизводство,
эмоции,
средства
общения.
Впрочем
эмоции
также
присущи особям.
Похоже, что в
первичном
виде эмоции служат
поведенческм
целям. Это
есть род знаний,
ведущий к
немедленному
действию. Как ни
крути, а не
очень
понятно
зачем нам именно
нужен
аналог
живого
существа.
Почти всё
можно
сымитировать
более или
менее удачно.
Не
поддается
имитации
пока именно
сообщество
живых/разумных.
Именно
групповые свойства. Всё
это наводит
на
определенное
размышление:
Либо мы
разум
имитируем,
либо мы его
растим. На
первом пути
есть
прогресс.
Второй путь
явно
предполагает
создание
определенной
среды для
роста
сообщества
существ. Т.е.
имитация
окружения и
создание
некоторого
сообщества
первичных
существ с механизмами
адаптации
вида. Можно
ускорить
прогресс,
создав их не
слишком
простейшими
типа
аминокислот.
А, скажем, на
уровне
амёбы. Но
даже
компьютерная
имитация
сообщества
представляется
большой
проблемой.
Слишком
много
связей:
каждый
контачит с
каждым, сложность
общения
быстро
станет
непомерно высока
для
компьютера. Значит
надо
делатьотдельные
встроеные компьютеры
и задавать
какие-то первичные
ориентиры
выживания.
Причем реальные.
Иначе разум
вырастет
человеку
непонятным.
Хм. Мысль. А не
получится
ли так,Ю что
при любой
схеме
развития
разум
получится
враждебным
человеку
из-за
принципиально
разной
эволюционной
среды? Почему
конкретно
враждебной?
Да потому,
что
непонятной.
Даже люди из
соседних
стран со
слегка
отличающимися
культурами
постоянно
друг с
другом враждуют.
А тут
какие-то
механизмы... . Надо
хорошо
понять
зачем нам
всё это надо.
Теоретически
можно
представить,
что удается
выращивать
что-то
целенаправленное.
К примеру, с
выдающимися
способностями
в чем-то. Но это
будет жизнь
и как всякая
жизнь, она
будет плохо
управляемой.
Она будет
бороться за существование
и против
ограничений.
Как Франкенштейн. С
научной
точки
зрения
могла бы
представлять
интерес
ограниченная
модель
жизни. Т.е.
отработать
механизмы
развития и
адаптации и
перенести
её на
искуственную
почву.
Скажем,
наделив
некоторые
бытовые
приборы
этими
свойствами.
Как тамагочи.
Каждый
домашний
прибор
должен по
жизни набираться
знаний об
окружающем
его мире.
Привыкать к
домашним,
требовать
ласки,
скучать, ревновать
хозяев к
другим себе
подобным. В
назначеное
время
взяться
передовать
опыт более
молодым
себе
подобным, а
когда те
подрастут,
уступить им
место. Это
очень
любопытно:
окружающие
нас железки
будут
одушевлены.
Они будут
индивидуальны,
покольку со
временем
заложенная
в них
программа
претерпит
огромные
изменения
под
влиянием
окружающей
действительности.
И будет на
исходное
мало похожа.
Это как
первичный
небольшой
отрезок ДНК,
на который
налепилась
длиннющая
цепь
последующего
опыта. Жить
среди
одушевленных
вещей: часы,
телевизор,
пиджак,
блокнот,
стул, дверь... .
Пусть не говорят,
но
чувствуют,
запоминают,
жаждут общения.
Живут своей
жизнью и
очень
зависят от
нас. ... Не
представить...
. 28
дек 2000. |
Smart Neuron with multi-output.
СМ является
обобщением
простого
нейрона, в
основном, в
целях
аппроксимации
многомерных
функций. Для
моделирования
интеллекта
не очень
понятно как
его
использовать.
Можно рассмотреть
более
сложную
схему:
входной уровень,
на который
подается
информация.
Порядок
подачи
другой. Нет
прямого
отличия между
обучением и
исполнением.
Обучение идет
параллельно
с
исполнением
всю жизнь.
На выходе
вектор
управляющих
импульсов (УИ),
которые
регулируют
положение
тела (Т) в
фазовом пространстве,
относительно
объекта-
носителя
опасности
(НО).
Сенсоры
фиксируют
объект,
поступают
управляющие
сигналы к
мышцам, в
соответствии
с матрицей
весов.
Вычисляется
«значение опасности»
(ЗО) - число.
Первоначальное
значение
выходного
вектора таково,
что подача
сигналов к
мышцам
должна привести
к такому
изменению
положения Т,
при котором
опасность
наверняка
уменьшится.
Т.е. снова
замеряется
входной
вектор и вычисляется
новое
значение ЗО и
новый
выходной
вектор УИ.
Если
опасность
уменьшается
недостаточно
быстро, можно
попробовать
совершить небольшие
движения в
сторону,
чтобы определить,
является ли
это
направление
движения
оптимальным
или стоит
выбрать
другое?
Living System
(Попытка
простейшего
моделирования
поведения
живого
объекта)
Живое
не может быть
изолировано
от среды. Иначе
ему не зачем
быть. Живое –
это всегда СИСТЕМА.
Критерии:
1. опасность-О,
2. еда-Е,
3. размножение-Р.
Пространства
и
отображения.
1.
Пространство
положения.
Фазовое,
характеризуется
положением в
пространстве
и принятой
позой тела
ПП.
2.
Пространство
сенсоров – ПС.
Характеризуется
входным
вектором
информации
об окружающем
мире на
синапсы
нейронов.
3.
Пространство
акций – ПА.
Элемент
этого пространства
– вектор всех
управляющих
сигналов,
поданных
мышцам для
изменения
положения в
ПП.
4.
3-пространство
ПК критериев
О, Е, Р,
оцененных по
ПС.
5.
1-обобщенный
критерий К
(пр-во ПОК) для
принятия
решения об
управляющем
векторе в ПА.
6.
Поведенческие
мотивы.
Система
внутреннего
и внешнего поощрения
и наказания,
как
преимущественных
направлений
лбучения и
тренинга.
Еще
нужна память
для
складирования
векторов
параметров моделей.
Нужен сон – для свободного от накопления информации времени для тренинга моделей поведения нейронов.
Нужны
враги – конкуренты.
Нужно пространство
для пищи,
где можно
пастись.
Нужны самки
для размножения.
И.т.д.
Нужны
пороговые
значения
ТО,ТЕ,ТР для
опасности,
голода и
размножения.
Схема
примерно
такая:
-
Существо
С – пасется.
Периодически
происходит
оценка
окружающей
среды. Вектор
сенсоров
поступает в
нейроны, где
вычисляются
три критерия
по заранее
насчитанным
коэффициентам
АО, АЕ, АР.
-
Проверяется
на
установленные
пороги. Пороги
могут
меняться в
зависимости
от того как
давно С
размножалось,
насколько
голодно или
насколько
пугано.
-
При
переходе
порога,
скажем, ТО, С стопорится
для оценки
возможных
действий.
Вычисляется
управляющий
вектор из ПА,
путем выбора
коэффициентов
из памяти для
ситуации,
типичной к
данной. Т.е.
происходит распознавание
ситуации и
выбор лучшей
стратегии.
-
С
приводится в
движение. Прыжок
от опасности.
-
После
прыжка
оценивается
насколько
уменьшилась
опасность.
Если
незначительно,
производятся
колебания,
с оценкой
возможно
лучшего
решения, чем
заложено в
памяти.
Фактически
вычисление
частных
производных.
-
И
дальнейший
прыжок в
лучшем
направлении
если
опасность
всё еще выше
порога.
Причем порог
автоматически
повышается
ввиду
близости
опасности.
-
Если
опасности
повторяется
часто, точность
вычисления
опасности
может быть
снижена для
ускорения
акций.
Таким
образом,
система действий
дискретна.
Более
непрерывные
решения
могут
применяться
для
добывания
пищи. Причем
они должны
различаться
для травоядных
(ТЯ) и
хищников(ПЯ).
Для хищников
опасностью
является не
съесть
кого-то.
Поэтому решения
должны быть
дискретными
по типу реакции
на опасность.
Про
размножения
наверное
менее
понятно. Но
понятно, что
накопленный
опыт надо
кому-то
передавать,
иначе
накопленная
информация
будет
тормозить
развития в
условиях изменения
окружающей
среды.
Молодняк
должен
начинать с
отправной
точки опыта
предка. Но он
короткий, что
дает
возможность
принимать
решения
быстро, пусть
и не очень
точно. За
счет
скорости
идет
выживание и
большее
накопление
информации.
У
стариков
движения
более точные,
но они надолго
замирают для
вычисления.
СОН –
Дневной
накопленный опыт
– это анализ
прожитого
дня в
спокойной обстановке.
Снова
подается на
сенсоры набор
входных
векторов,
накопленный
в памяти за
день. И
оценки
действий.
В
результате
происходит
хорошо
знакомый процесс
тренинга
нейронной
сети. Днем –
только
исполнение и
накопление
опыта.
Окружающая среда тоже должна меняться. Иначе система может достичь оптимума и отказаться от дальнейшего видоизменения.
Основное отличие от обычной нейронной модели в том, что в тренинге участвуют два вектора и один скаляр. Т.е. вектор состояния, управляющий вектор и оценка действия.
_