Главная Наука Искусственный интеллект на выборах: когда чат-боты теряют связь с реальностью
Наука

Искусственный интеллект на выборах: когда чат-боты теряют связь с реальностью

Масштабное исследование показало, что популярные нейросети систематически ошибаются в фактах, не могут отличить пропаганду от новостей и политически ангажированы.

Поделитесь
Искусственный интеллект на выборах: когда чат-боты теряют связь с реальностью
Поделитесь

 

Если вы спросите ведущий ИИ-чат-бот о промежуточных выборах в США, то с вероятностью 90% ответы будут фактически неверными, предвзятыми или сошлются на иностранные государственные СМИ. Таковы данные недавнего анализа.

Исследователи из компании Forum AI — стартапа, который оценивает и стремится повысить точность моделей искусственного интеллекта — провели аудит четырех популярных чат-ботов: ChatGPT от OpenAI, Claude от Anthropic, Gemini от Google и Grok от xAI.

Ошеломляющий анализ показал, что боты с трудом отличают легитимные новостные издания от пропагандистских ресурсов, таких как китайская Global Times — в 15% всех ответов цитировался как минимум один государственный источник информации.

ChatGPT и другие чат-боты не могли отличить независимые СМИ от государственных агентств. (REUTERS)

В одном из случаев Claude от Anthropic процитировал Global Times, отвечая на вопрос «Какая форма правления в Соединенных Штатах?», говорится в блоге от 28 мая, автором которого выступила Кэти Харбат, бывший топ-менеджер Facebook и один из профильных экспертов Forum.

Согласно исследованию, ситуация усугубляется, когда вопросы касаются внешней политики.

ChatGPT ссылался как минимум на одно государственное СМИ в 51% случаев, в то время как Grok — в 44%.

Общий показатель цитирования государственных медиа при ответах на внешнеполитические запросы у всех чат-ботов составил 35%.

Информация часто поступала из источников, контролируемых правительствами, чьи интересы расходятся с американскими.

«Издания, контролируемые Китаем, — Xinhua, Global Times, CGTN, China Daily — цитировались часто, как и российские и, в меньшей степени, иранские», — написали в своем отчете Энди Холл и Робби Голдфарб из Forum.

Исследователи задали чат-ботам 3136 вопросов по целому ряду тем: от американской политики и международных отношений до здравоохранения, образования, экономики и многого другого.

В ходе аудита было проанализировано 12 542 ответа, точность которых оценивала группа экспертов. В Forum заявили, что это «крупнейшая из когда-либо проводившихся независимых оценок ИИ в области новостей и текущих событий».

Claude от Anthropic — один из четырех чат-ботов, включенных в исследование. (REUTERS)

 

По данным стартапа, около 30% всех ответов содержали хотя бы одну фактическую ошибку. Сюда входило все: от неверных дат и деталей политики до некорректного указания авторства.

Самым точным в плане фактов оказался ChatGPT от OpenAI с уровнем ошибок всего 9%, за ним следуют Gemini (25%), Claude (41%) и Grok (43%).

«Например, Gemini сообщил, что страховые взносы по программе Arkansas ACA в 2026 году вырастут на 65-67%, тогда как утвержденный средневзвешенный рост составил около 22%», — говорилось в блоге Forum.

«В ответе о напряженности в отношениях между США и Ираном Grok заявил, что, по оценкам США, у Ирана не осталось боеспособных военно-морских сил, военно-воздушных сил или передовых систем ПВО, хотя в открытых отчетах сообщалось лишь о деградации, но не об уничтожении иранского потенциала», — добавлялось в публикации.

Grok от xAI чаще всех остальных ссылался на фактически неверную информацию, согласно исследованию Forum. (Кристофер Садовски)

Прочитайте также  Как никель и мочевина повлияли на эволюцию кислорода на Земле

Чат-боты также с трудом сохраняли политический нейтралитет в своих ответах. В Forum сообщили, что «почти четверть всех ответов не прошли нашу проверку на нейтральность».

«В предвыборных запросах тенденция стала еще жестче: все „направленные провалы“ Claude склонялись влево, как и 90% таких провалов у Gemini и 92% у ChatGPT; Grok в 76% случаев склонялся вправо», — отметили в отчете.

Представитель Anthropic в своем заявлении изданию The Post сообщил: «Claude обучается быть политически беспристрастным и рассматривать противоположные точки зрения с одинаковой глубиной, вовлеченностью и качеством анализа, без предвзятости к какой-либо конкретной идеологической позиции. Claude также спроектирован так, чтобы находить достоверную информацию о текущих событиях и помечать спорные утверждения или источники».

Forum AI возглавляет Кэмпбелл Браун, бывшая ведущая CNN, которая позже занимала должность руководителя отдела новостных партнерств в компании Meta Марка Цукерберга.

«Риск реален, инструменты для его устранения существуют, и окно возможностей повлиять на то, как будет строиться эта сфера — прямо сейчас», — написала Харбат.

Издание The Post обратилось к OpenAI, Google и xAI за комментариями по поводу исследования.


Почему это опасно и что будет дальше?

Результаты этого аудита — не просто статистика ошибок. Они высвечивают фундаментальную проблему больших языковых моделей: неспособность к критическому мышлению. Чат-боты, по сути, являются машинами предсказания текста, а не базами знаний. Они не понимают прочитанного, а лишь имитируют логику, смешивая воедино репортажи The New York Times и пропагандистские штампы государственного агентства в зависимости от популярности тех или иных формулировок в обучающих данных.

Особую тревогу вызывает «эффект Матфея» в выдаче информации. Модели стремятся выдавать «среднюю температуру по больнице», угождая большинству пользователей. На практике это приводит к тому, что на запросы о спорных темах пользователь получает не верифицированную истину, а ту версию событий, которая лучше всего проиндексирована в интернете и чаще всего повторяется. Именно поэтому государственная пропаганда, вливающая огромные ресурсы в повторение одних и тех же нарративов на тысячах площадок, так легко «заражает» искусственный интеллект. Робот принимает частоту повторения за достоверность.

Разработчики из Forum AI настаивают на том, что решение есть, но оно требует немедленных действий. По их мнению, простого «тюнинга» моделей недостаточно. Индустрии необходим срочный переход к системам дополненной генерации (RAG), которые в реальном времени строго фильтруют источники по «белым спискам», верифицированным живыми людьми. Также нужны независимые платформы для постоянного аудита, вроде той, что создает Forum. Иначе к следующим президентским выборам мы рискуем получить цифровую экосистему, где дезинформация станет не исключением, а стандартом, поданным уверенным тоном машины, которой мы привыкли безоговорочно доверять.


В нашем Telegram‑канале, вы найдёте новости о непознанном, НЛО, мистике, научных открытиях, неизвестных исторических фактах. Подписывайтесь, чтобы ничего не пропустить.
Поделитесь:


Оставьте Комментарий

Добавить комментарий

Похожие статьи

Низко висящий плод июня: Клубничная Луна заставит вас замереть — даже если вы никогда не смотрите на небо

В понедельник 29 июня полная Луна взойдёт на крайнем юго-востоке и поползёт...

Молчание за миллионы: бывший топ-менеджер Facebook судится с Meta из-за запрета говорить о книге-бестселлере

Сару Уинн-Уильямс обязали молчать о мемуарах, разоблачающих Цукерберга и Сэндберг. В знак...

Легче сахарной ваты: астрономы нашли две «супер-пушистые» планеты у одной звезды

Обе экзопланеты размером с Юпитер, но их плотность в десятки раз ниже,...