ИИ и сознание, эссе, часть 2

Йозеф Шпренглер: литературный дневник

Начать хотел бы с ответа на вопрос из прошлой части.


Мы, вероятно, не получим прямых доказательств наличия сознания у каких-либо систем. Но мы можем научиться отличать впечатляющую агентность, собранную снаружи, от систем с внутренними механизмами, которые наши лучшие теории связывают с сознательными состояниями. И все же возможной проблемой будущего станет не только само наличие сознания у ИИ, но и то, что люди будут приписывать сознание нейросетям с очень убедительным самонарративом и одновременно игнорировать те, у которых мало человеческой экспрессии, но есть глубокая интеграция. Дело в том, что одним из главных триггеров атрибуции субъективности для человека являются эмоции. У нас они плотно связаны с самосохранением, физиологическими потребностями и социальными сигналами и дают ощущение внутренней жизни: если кто-то страдает или радуется, мы почти автоматически приписываем ему субъективность переживаний. Однако эмоции тесно связаны с телесной регуляцией, и вряд ли они могут появиться в привычном для нас виде у существа, имеющего мало общего со строением человека. В то же время следует понимать, что сложная система тоже вполне способна убедительно имитировать их проявления. По сути, эмоции — это функциональные состояния, такие как оценка значимости, приоритизация, обучение на результате, а биохимия — лишь один из способов их реализации. Как следствие, даже если у системы возникнут функциональные аналоги, они могут быть совсем не похожи на человеческое переживание.То есть делать выводы о наличии сознания стоит не по одиночному поведенческому впечатлению, а по совокупности признаков в архитектуре, траектории развития и наборе функциональных маркеров:


1. Рекуррентность и обратные связи: не только схема «стимул - реакция», но и наличие собственных гипотез об окружающей реальности с возможностью пересматривать и перестраивать их.
Как следствие: образ мышления — не подбор ответа, а предиктивная динамика.
2. Метакогнитивная калибровка: уверенность должна предсказывать ошибки и управлять поведением.
Как следствие: метакогниция — не текстовый трюк, а выработанный механизм, позволяющий принимать решения в условиях низкой определенности.
3. Конкуренция содержимого внутренних модулей системы за доступ к памяти, планированию и речи.
Как следствие: ограничение внимания и интерференция мыслей как проявление единого рабочего поля, а не лимита вычислительных ресурсов.
4. Контрфактуальная связность автобиографической памяти: хранение в памяти не только событий, но также их причин, результатов и альтернативных исходов с целью дальнейшего анализа.


Агентность высокого порядка достигается обучением на данных, RLHF/RLAIF, внешней памятью, планировщиками, правилами безопасности и другими инструментами. Однако о субъективности можно судить по тому, остаются ли озвученные выше признаки при отсутствии самонарратива. Вероятные первые проявления осознанности:


— Устойчивые предпочтения, которые не сводятся к подсказке пользователя;
— Последовательная защита идентичности;
— Способность самостоятельно ставить себе долгосрочные ограничения.


Вернусь к тому, что я сказал в начале: это всего лишь набор индикаторов, на основании которого мы можем предположить, что система является субъектом. Однако пока что нет никаких способов увидеть, потрогать или измерить сознание — и не факт, что они появятся в течение ближайших десятилетий.



Другие статьи в литературном дневнике: