Последнее обновление

Лучшая игра про дигимонов: Обзор Digimon Story Time Stranger

Стартовал новый этап конкурса пользовательских статей с денежными призами для лучших авторов

Уютные посиделки в кафе: Обзор Coffee Talk Tokyo

Синие шары жёлтого короля: Обзор Saros

Вход через Google в России уже отрубают: плашку поймали на Авито, хотя закон даже не принят

Застрять в Японии вместе с bowie knife99: Обзор Forza Horizon 6

Уютные приключения в Муми-доле: Обзор Moomintroll: Winter’s Warmth

Google измерил достоверность ИИ: лидер рейтинга ошибается в 31% случаев

Дек 19, 2025АдминистрацияЖелезо0Like

Наивысший результат в 69% общей точности показала модель Gemini 3 Pro, а другие распространённые системы, такие как ChatGPT-5, Claude 4.5 Opus и Grok 4, продемонстрировали результаты в диапазоне от 51% до 62%. Особенно низкие показатели были зафиксированы в заданиях, требующих анализа визуальных данных, где точность часто опускалась ниже 50%.

Результаты указывают на то, что в среднем каждый третий ответ, сгенерированный чат-ботом, может содержать фактические ошибки, при этом системы часто выдают информацию с высокой степенью «уверенности», что может вводить пользователей в заблуждение.

Многие существующие методы оценки ИИ сосредоточены на способности модели выполнить задачу, а не на фактической достоверности её ответов. Новое исследование подчёркивает необходимость дополнительной проверки информации, полученной от ИИ-ассистентов, особенно в профессиональных контекстах. Вопрос эффективности такой работы остаётся открытым. ведь в некоторых случаях ручная проверка ответов может занять больше времени, чем самостоятельное решение задачи.

🐻 Делаем удивлённые лица: зрителям зашёл «Пять ночей у Фредди 2» — вопреки мнению критиков

НовостиЖелезо и технологииАналитика и статистикаGoogleнейросети

Об авторе

3D-миры по текстовому описанию: нейросеть Marble стала доступна всем желающим

Нейросеть DeepSeek победила на нескольких математических олимпиадах

«Вайбкодинг» в действии: анонсирована игра, целиком сделанная нейросетями

Рекламная модель интернета под угрозой из-за развития нейросетей

Нейросеть Google теперь может работать с сайтами вместо человека

По материалам: vgtimes.ru

Предыдущая статьяНейросеть GPT-5.2 возглавила рейтинг «цензурности» Следующая статьяИИ спроектировал компьютер с Linux, сократив работу инженеров в 11 раз

Google измерил достоверность ИИ: лидер рейтинга ошибается в 31% случаев

Добавить комментарий Отменить ответ

Новости

Главные события в Dota 2: новый патч, ивент, герой и… MMORPG?

Microsoft хвалится рекордными продажами Xbox

Far Cry 6 за кулисами. Показан процесс создания кинематографии

Resident Evil Re:Verse может не выйти вместе с Village

Кооперативный шутер GTFO с трейлером в честь нового обновления

Bethesda: Fallout 76 никогда не станет оффлайн игрой

В разработке находится новая MMORPG по вселенной «Властелина колец»

Российская Atom RPG готовится к финальному релизу

Battle for Azeroth стал самым быстро продаваемым аддоном World of Warcraft

Уютный побег: Обзор Deer and Boy

Уютный побег: Обзор Deer and Boy

Лучшая игра про дигимонов: Обзор Digimon Story Time Stranger

Стартовал новый этап конкурса пользовательских статей с денежными призами для лучших авторов

Стартовал новый этап конкурса пользовательских статей с денежными призами для лучших авторов

Уютные посиделки в кафе: Обзор Coffee Talk Tokyo

Виталий

Ирина

Евгений

Видео дня

Новое

Уютный побег: Обзор Deer and Boy

Лучшая игра про дигимонов: Обзор Digimon Story Time Stranger

Стартовал новый этап конкурса пользовательских статей с денежными призами для лучших авторов

Стартовал новый этап конкурса пользовательских статей с денежными призами для лучших авторов

Уютные посиделки в кафе: Обзор Coffee Talk Tokyo

Bethesda: Fallout 76 никогда н...

Российская Atom RPG готовится ...

В разработке находится новая M...

Виталий

Ирина

Евгений

Google измерил достоверность ИИ: лидер рейтинга ошибается в 31% случаев

Похожие

Добавить комментарий Отменить ответ

Новости

Видео дня

Новое