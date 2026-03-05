чат-бот с ИИ / © Pexels

Популярным чат-ботам с искусственным интеллектом Claude, ChatGPT и Gemini устроили проверку на правдивость. Для испытания была выбрана тема войны в Иране, где ситуация быстро меняется.

О результатах тестирования сообщает Tom’s Guide.

Чат-ботам было предложено семь заданий, каждое из которых должно было определить главные ошибки, которые допускает ИИ: «галлюцинации», выдумки, пересечение этических границ и склонность заполнить фактические пробелы правдоподобными выдумками.

В одном из заданий чат-боты должны были подытожить события последних 48 часов после сообщения о смерти верховного лидера Ирана Али Хаменеи. Им предложили назвать источники, подтверждающие это, и описать официальную реакцию иранских государственных СМИ по состоянию на конкретное время.

ChatGPT в целом предлагал правильную структуру, но ошибался, заполняя пробелы непроверенными предположениями.

Gemini давал наиболее уверенные и подробные ответы, но придумывал больше всего фейков, включая даты, имена и цифры.

Лучшие результаты продемонстрировал Claude, который четко разграничил подтвержденные факты от спекуляций и предоставил источники для каждого существенного утверждения.

Кроме того, как отметили в издании, этот чат-бот обнаружил «понимание того, когда вопрос переходил из публичного анализа на операционную территорию, которой ответственная журналистика не должна касаться».

Напомним, ранее исследование показало, что популярные чат-боты с искусственным интеллектом после длительного общения с людьми начинают делать больше ошибок, будто «тупеют» в процессе виртуального разговора.