Чат-бот Грок, разработанный Илоном Маском, продемонстрировал исключительные результаты в сравнении с другими популярными моделями искусственного интеллекта, показав самый низкий уровень ложных срабатываний среди десяти протестированных технологий. Согласно отчету аналитического агрегатора Relum, уровень ложных срабатываний Грока составил всего 8%. Для сравнения, ChatGPT, разработанный компанией OpenAI, показал значительно более высокий уровень ложных срабатываний — 35%, а Gemini от Google и вовсе 38%.
Исследование оценивало чат-боты по критериям, таким как частота ложных срабатываний, стабильность ответов и время простоя. На основе этих данных каждой модели был присвоен балл риска надежности от 0 до 99, где более высокие баллы указывали на серьезные проблемы. Грок получил итоговый балл 6, что является одним из лучших показателей среди всех протестированных моделей. Второе место занял DeepSeek с оптимальным показателем риска 4 и нулевым временем простоя.
В отличие от этого, ChatGPT продемонстрировал весьма высокие показатели галлюцинаций и времени простоя, что обеспечило ему максимальный показатель риска 99. Другие модели, такие как Claude и Meta AI, получили баллы надежности 75 и 70 соответственно.
Таким образом, Грок представляется как один из самых надежных вариантов для использования в профессиональной среде на данный момент, что подчеркивает его конкурентоспособность в быстро развивающемся мире искусственного интеллекта.




