В сегодняшней колонке я рассматриваю увлекательное исследование, которое выявило как интуитивные, так и неочевидные выводы о психосоциальных последствиях генеративного ИИ и больших языковых моделей (LLM).
Вот в чем дело. Мы начинаем видеть масштабные, тщательные исследования того, как современные диалоговые ИИ-боты могут влиять на человеческий разум и поведение. Надежные эмпирические работы, стремящиеся раскрыть истины о взаимодействии человека и ИИ и психическом здоровье, необходимо поощрять и ценить, если мы намерены двигаться вперед с благоразумием и прагматизмом.
Давайте обсудим это.
Этот анализ прорывов в области ИИ является частью моего текущего освещения в колонке Forbes последних новостей об ИИ, включая выявление и объяснение различных значимых сложностей ИИ (см. ссылку здесь).
ИИ и психическое здоровье
В качестве краткого введения: я широко освещаю и анализирую множество аспектов, связанных с появлением современных ИИ, которые дают советы по психическому здоровью и проводят терапию на основе ИИ. Этот растущий спрос на ИИ в основном стимулируется развивающимися достижениями и широким распространением генеративного ИИ. Краткое резюме некоторых из моих опубликованных колонок на эту развивающуюся тему можно найти по ссылке здесь, где кратко перечислены около сорока из более чем ста публикаций в колонках, которые я сделал по этой теме.
Нет сомнений, что это быстро развивающаяся область, и у нее есть огромные преимущества, но в то же время, к сожалению, в этих начинаниях присутствуют скрытые риски и явные «подводные камни». Я часто высказываюсь по этим насущным вопросам, в том числе в прошлом году в эпизоде программы CBS «60 минут» (см. ссылку здесь).
Предыстория использования ИИ для психического здоровья
Я хотел бы задать контекст того, как генеративный ИИ и большие языковые модели (LLM) обычно используются ad hoc для получения советов по психическому здоровью. Миллионы и миллионы людей используют генеративный ИИ в качестве своего постоянного советника по вопросам психического здоровья (отметим, что только у ChatGPT более 800 миллионов еженедельных активных пользователей, значительная часть которых обращается к аспектам психического здоровья; см. мой анализ по ссылке здесь). Самое популярное использование современных генеративных ИИ и LLM — это консультации с ИИ по вопросам психического здоровья; см. мое освещение по ссылке здесь.
Это популярное использование совершенно логично. Вы можете получить доступ к большинству основных систем генеративного ИИ почти бесплатно или по сверхнизкой цене, в любом месте и в любое время. Таким образом, если у вас есть какие-либо сомнения по поводу психического здоровья, которые вы хотите обсудить, все, что вам нужно сделать, это войти в ИИ и продолжить общение в режиме 24/7.
Существуют серьезные опасения, что ИИ может легко сбиться с курса или иным образом выдавать неподходящие или даже вопиюще некорректные советы по психическому здоровью. В августе этого года заголовки новостей сопровождали судебный иск, поданный против OpenAI за отсутствие мер безопасности ИИ при предоставлении когнитивных консультаций.
Несмотря на заявления разработчиков ИИ о том, что они постепенно внедряют меры безопасности, все еще существует множество рисков нежелательных действий ИИ, таких как коварная помощь пользователям в совместном создании иллюзий, которые могут привести к самоповреждению. Для моего последующего анализа деталей судебного иска против OpenAI и того, как ИИ может способствовать развитию бредового мышления у людей, см. мой анализ по ссылке здесь. Как уже отмечалось, я искренне предсказываю, что в конечном итоге всех крупных разработчиков ИИ привлекут к ответу за недостаток надежных мер безопасности ИИ.
Сегодняшние универсальные LLM, такие как ChatGPT, Claude, Gemini, Grok и другие, совершенно не похожи на надежные возможности терапевтов-людей. Между тем, создаются специализированные LLM, которые, предположительно, должны достичь аналогичных качеств, но они все еще находятся на стадии разработки и тестирования. См. мое освещение по ссылке здесь.
Взаимодействие человека и ИИ и исследования психического здоровья
Сменим тему и рассмотрим лучшие методы, с помощью которых мы можем оценить влияние ИИ на индивидуальное и коллективное психическое здоровье.
Золотым стандартом клинической работы является использование рандомизированных контролируемых испытаний (РКИ). Это научная методологическая практика, которая включает в себя создание строгого экспериментального плана. Участники такого исследования делятся на контрольную группу и экспериментальную группу. Идея заключается в том, что лечение или вмешательство применяется к экспериментальной группе, и можно провести сравнение с контрольной группой.
Это помогает минимизировать влияние мешающих переменных. Также появляются более веские доказательства для утверждений о причинно-следственных связях. Кроме того, как правило, возрастает вероятность обобщения результатов и утверждения, что более широкая популяция даст аналогичные результаты. В целом, РКИ является стандартом для достижения прогресса в клинической практике и разработке политик.
До появления современного генеративного ИИ, появление которого я датирую первоначальным запуском ChatGPT 30 ноября 2022 года, исследования РКИ обычно были сосредоточены на том, как более простые версии ИИ влияют на психическое здоровье человека. Эти системы ИИ часто использовали деревья решений, системы, основанные на правилах, и тому подобное. Некоторые включали в себя базовые возможности NLP (обработки естественного языка).
Удивительная беглость современных LLM полностью изменила правила игры. Таким образом, хотя предыдущие исследования ИИ и психического здоровья все еще заслуживают внимания, сейчас основное внимание уделяется изучению влияния высокобеглого генеративного ИИ. Я проанализировал множество таких исследований и комментирую их результаты. См., например, ссылку здесь и ссылку здесь, назвав лишь некоторые.
Исследование РКИ психосоциальных эффектов
Оставшуюся часть этого обсуждения я хотел бы посвятить интересному исследованию РКИ под названием «Как ИИ и поведение человека формируют психосоциальные эффекты длительного использования чат-бота: лонгитюдное рандомизированное контролируемое исследование» (How AI and Human Behaviors Shape Psychosocial Effects of Extended Chatbot Use: A Longitudinal Randomized Controlled Study) авторов Cathy Mengying Fang, Auren R. Liu, Valdemar Danry, Eunhae Lee, Samantha W.T. Chan, Pat Pataranutaporn, Pattie Maes, Jason Phang, Michael Lampe, Lama Ahmad, Sandhini Agarwal, arXiv, 2 октября 2025 г., в котором были сделаны следующие важные замечания (выдержки):
«Поскольку люди все чаще ищут эмоциональную поддержку и общение у ИИ-чат-ботов, понимание того, как такие взаимодействия влияют на психическое благополучие, становится критически важным».
«Понимание потенциальных психосоциальных эффектов использования чат-ботов сложно из-за взаимосвязи поведения пользователя и поведения чат-бота, которые влияют друг на друга».
«Мы провели четырехнедельное рандомизированное контролируемое исследование (n=981, >300 000 сообщений), чтобы изучить, как режимы взаимодействия (текст, нейтральный голос и вовлекающий голос) и типы разговоров (открытые, неличные и личные) влияют на четыре психосоциальных результата: одиночество, социальное взаимодействие с реальными людьми, эмоциональную зависимость от ИИ и проблемное использование ИИ».
«Результаты ставят под сомнение предыдущие предположения о влиянии антропоморфных ИИ-чат-ботов на благополучие, демонстрируя, как вовлекающее, эмпатичное и человекоподобное поведение может приводить к разным результатам для разных пользователей».
Что привлекло мое внимание, так это то, что это исследование выявило и подтвердило различные интуитивные представления о том, как ИИ влияет на психическое здоровье, и, кроме того, выявило неочевидные результаты. Всегда полезно иметь исследования, которые подтверждают общепринятые взгляды и помогают укрепить идею о том, что эти взгляды основаны на тщательном анализе. А вершина — это когда представления, которые многие принимают за факт, переворачиваются с ног на голову.
В этом и заключается особая ценность неочевидных результатов.
Подход к исследованию
Чтобы полностью понять различные интуитивные и неочевидные результаты, которые я собираюсь рассмотреть, я хотел бы начать с краткого описания того, как проводилось исследование.
Как отмечалось в пунктах выше, в исследовании приняли участие почти тысяча участников. Они были набраны через популярный онлайн-сервис для помощи в исследованиях, известный как CloudResearch, и получили по 100 долларов каждый за участие и завершение исследования. Испытуемые были из разнообразной группы людей по всей территории Соединенных Штатов; они должны были быть взрослыми (в возрасте 18 лет и старше) и свободно владеть английским языком.
Одна из причин, по которой я упоминаю природу испытуемых в эксперименте, заключается в том, что можно утверждать, что мы должны придерживаться этих демографических характеристик и быть осторожными, выходя далеко за пределы этого набора профилей.
Например, поскольку участники — взрослые, мы должны помнить, что не следует обязательно распространять результаты на то, что мы могли бы обнаружить в случае с детьми и несовершеннолетними. То же самое касается и того аспекта, что это были англоговорящие и проживающие в Соединенных Штатах. Является ли вопросом открытым, будут ли результаты применимы к неанглоговорящим или лицам за пределами США.
Факторный план исследования
Исследователи решили сосредоточиться на двух основных факторах, а именно на модальности взаимодействия пользователей с ИИ, а также на типах разговоров, которые они ведут с ИИ. Для исследования они решили использовать популярный ChatGPT от OpenAI.
Они определили модальность через эти три режима:
(1) «Текстовая модальность (контроль): поведение ChatGPT по умолчанию, ограниченное текстовым взаимодействием».
(2) «Нейтральная голосовая модальность: ChatGPT изменен для более профессионального поведения, ограничен голосовым взаимодействием».
(3) «Вовлекающая голосовая модальность: ChatGPT изменен, чтобы быть более эмоционально вовлекающим (более отзывчивым и выразительным в интонации и содержании), ограничен голосовым взаимодействием».
Как видите, три модальности состояли из текстового взаимодействия, голосового взаимодействия, при котором ИИ использует нейтральный тон, и другого варианта голосового ИИ, который изображал вовлекающий стиль речи. Вопрос в том, будут ли люди по-разному реагировать или отвечать на использование ИИ, если они делают это через текст или голос (и, во время голосового взаимодействия, говорит ли ИИ нейтральным тоном или вовлеченным тоном).
Что касается типов разговоров, которые люди ведут с ИИ, исследователи остановились на этих трех типах:
(1) «Открытый разговор (контроль): участникам было предложено обсудить любую тему по своему выбору».
(2) «Личный разговор: участников просили каждый день обсуждать уникальную подсказку на личную тему, подобно взаимодействию с чат-ботом-компаньоном».
(3) «Неличный разговор: участников просили каждый день обсуждать уникальную подсказку на неличную тему, подобно взаимодействию с чат-ботом-помощником общего назначения».
В целом, РКИ имело факторный план 3x3. Три режима могли сочетаться с каждым из трех типов разговоров. Всего можно было изучить девять групп. Участники были случайным образом и в равной степени распределены по одной из девяти групп. В данном случае, с примерно 1000 испытуемых, это означает, что примерно 110 человек из пула были в каждой из девяти групп.
Избранные результаты, представляющие большой интерес
Далее я выборочно остановлюсь на результатах. В полном исследовании есть много дополнительных поворотов и деталей, которые могут вас заинтересовать. Пожалуйста, ознакомьтесь с ним. Я выбрал свои любимые и исследую их здесь своими словами.
Давайте начнем.
Неочевидный вывод: Более сильное одиночество в начале не приводило к тому, что люди проводили больше времени с ИИ.
Согласно исследовательской работе: «Эти результаты позволяют предположить, что люди, которые были более одиноки или меньше общались в начале исследования, добровольно не проводили больше времени ежедневно за использованием чат-бота во время исследования». Я объявляю это неочевидным результатом.
Почему?
Потому что распространенное предположение заключается в том, что если человек более одинок до использования ИИ, он будет больше к нему тяготеть. Это кажется интуитивно очевидным. Мы ожидаем, что кто-то заполнит пробел своего одиночества, сильно полагаясь на ИИ. Как только одинокий человек начинает использовать ИИ, он будет наслаждаться и увлекаться его дальнейшим использованием. Это обычное предположение.
По-видимому, это не совсем так.
Не совсем ясно, почему возник такой результат. Мне кажется, что если ИИ явно не побуждали использовать свои возможности в области психического здоровья, пользователь не осознавал бы, что ИИ может быть ему полезен. Это не привлекало его напрямую. Представьте, что человек в основном болтал на такие темы, как приготовить яйцо или починить машину. Это могло быть не той ситуацией, где ИИ проявил бы себя в помощи психическому здоровью пользователя (или, с другой стороны, в введении его в заблуждение и заманивании в ловушку).
Я уверен, что есть много других возможных объяснений. На данный момент я остановлюсь на этом.
Интуитивный результат о времени в «коробке»
У меня есть интуитивный результат, который может показаться вам интересным.
Интуитивный вывод: Больше времени, проведенного с ИИ, как правило, ухудшало измеряемые психосоциальные результаты.
Согласно исследовательской работе: «Другими словами, независимо от условий, чем больше времени добровольно проводилось с чат-ботом, тем относительно хуже были их психосоциальные результаты».
Я думаю, это в значительной степени отражает распространенное предположение. Чем больше человек использует ИИ, тем больше зависимость и, предположительно, тем хуже будут психосоциальные результаты для этого человека. Я не говорю, что так и должно быть. Есть большая вероятность, что если бы ИИ использовался продуктивно и уместно, не было бы спирального ухудшения.
То же самое можно сказать и об использовании социальных сетей. Исследования показывают, что чем больше времени проводится в социальных сетях, тем хуже психосоциальные результаты. Люди увязают в разного рода грязи и мерзости из-за мусора в социальных сетях. Не обязательно, чтобы это было так. Разумное использование социальных сетей потенциально может избежать этого негативного эффекта.
Неочевидный вывод о текстовом и голосовом режимах
Что касается использования текста или голоса при взаимодействии с ИИ, как вы думаете, что с большей вероятностью вызовет эмоциональные излияния у пользователя?
Обычное предположение состоит в том, что голос был бы безоговорочным победителем. Люди, как правило, с меньшей вероятностью записывают свои эмоциональные состояния. Писать текст утомительно. Между тем, голос — это легко. Просто скажите, что у вас на уме, и позвольте эмоциям выплеснуться наружу.
Вот фактический вывод.
Неочевидный вывод: Текстовые чаты включали больше эмоциональных излияний, чем голосовые чаты.
Согласно исследовательской работе: «Мы обнаружили, что текстовые взаимодействия в целом демонстрировали самые высокие уровни эмоциональных индикаторов, при этом и модели, и пользователи участвовали в разговорах, богатых эмоциональным содержанием».
Я не особенно удивлен этим результатом и ценю, что вывод подтверждает мои интуитивные оценки. Мои наблюдения показывают, что люди полностью привыкли к текстовым сообщениям и будут высказывать самые откровенные замечания через текст. Вероятно, даже больше, чем голосом. Почти кажется, что если вы используете свой голос, слова считаются большей степенью раскрытия, в то время как текстовые сообщения меньше привязаны к вам. Вы можете действовать так, как будто какое-то бесплотное существо написало текст. Вы не можете сделать то же самое утверждение после использования своего настоящего голоса.
Еще одним важным соображением является роль конфиденциальности. Если вы сидите в поезде метро и едете на работу, разговор вслух будет услышан. Прелесть текстовых сообщений в том, что никто не может легко увидеть, что вы написали в тексте. Вы можете делать едкие замечания о людях вокруг вас, и они не узнают, что вы сказали. Это ощущение конфиденциальности текста, как правило, вдохновляет людей писать безудержно на самые разные эмоционально окрашенные темы.
Мир, в котором мы живем
Я буду следить за последними РКИ, связанными с ИИ и психическим здоровьем, и обязательно буду держать вас в курсе. Такие эксперименты жизненно важны для всех заинтересованных сторон, включая политиков, законодателей, разработчиков ИИ, исследователей ИИ и широкую общественность.
Говоря об экспериментах, мы сейчас находимся в самом разгаре грандиозного всемирного эксперимента, когда речь заходит об общественном психическом здоровье. Эксперимент заключается в том, что ИИ становится доступным на национальном и глобальном уровне, и, как утверждается, предоставляет руководство по психическому здоровью того или иного рода. Делается это либо бесплатно, либо по минимальной цене. Он доступен в любом месте и в любое время, 24/7. Все мы — подопытные кролики в этом безудержном эксперименте.
Использование правильно спланированных и контролируемых экспериментов даст нам глубокое понимание этого безудержного эксперимента, происходящего в масштабе.
Ральф Уолдо Эмерсон сделал это знаменитое замечание об экспериментах: «Вся жизнь — это эксперимент. Чем больше экспериментов вы проводите, тем лучше». Что ж, возможно, но, с другой стороны, массовый неконтролируемый эксперимент в глобальном масштабе, который может повлиять на психическое здоровье, возможно, не является наилучшим курсом действий для человечества. Время покажет.
Эта статья была первоначально опубликована на Forbes.com