
Grok, с его 8% «галлюцинаций», средним рейтингом 4.5, оценкой стабильности 3.5 и временем простоя 0.07%, получил совокупный индекс риска всего 6 баллов. Ближайшим конкурентом по общей надежности оказался DeepSeek с индексом 4, но его уровень «галлюцинаций» был почти вдвое выше — 14%. ChatGPT оказался на противоположном конце спектра с максимальным индексом риска в 99 баллов.
Точность ответов становится критически важной на фоне активного внедрения ИИ в бизнес-процессы. Согласно приведенным в отчете данным, около 65% компаний в США уже используют чат-ботов в повседневной работе, при этом почти 45% сотрудников признаются, что передавали таким сервисам конфиденциальную или чувствительную рабочую информацию.

Исследование выявило заметный разрыв между узнаваемостью бренда и фактической производительностью моделей. Несмотря на относительно меньшую распространенность, Grok показал себя как решение, потенциально более пригодное для задач, где на первом месте стоит точность фактов.
0
Поделиться:
НовостиЖелезо и технологиинейросетиOpenAIGoogleИлон Маск
Об авторе

xAI представила Grok 4.1: нейросеть научилась лучше понимать эмоции

3D-миры по текстовому описанию: нейросеть Marble стала доступна всем желающим

Россияне за год стали в шесть раз чаще использовать нейросети

Нейросеть DeepSeek победила на нескольких математических олимпиадах

«Вайбкодинг» в действии: анонсирована игра, целиком сделанная нейросетями
По материалам: vgtimes.ru









