GPT-5.5 очолила тест на пошук вразливостей, знайшовши вразливість у 7 з 10 спроб. DeepSeek V4 Pro показала нижчий результат, але була дешевшою. Claude моделі часто зупинялися через обмеження безпеки. Gemini здебільшого відмовлялася виконувати завдання. Експеримент не є офіційним бенчмарком. https://channeltech.space/ai/gpt-5-5-vulnerability-test-results/
GPT-5.5 очолила тест на пошук вразливостей, знайшовши вразливість у 7 з 10 спроб. DeepSeek V4 Pro показала нижчий результат, але була дешевшою. Claude моделі часто зупинялися через обмеження безпеки. Gemini здебільшого відмовлялася виконувати завдання. Експеримент не є офіційним бенчмарком. https://channeltech.space/ai/gpt-5-5-vulnerability-test-results/
CHANNELTECH.SPACE
ШІ-моделі перевірили на кібербезпеку: результати експерименту – Channel Tech
GPT-5.5 показала найкращі результати у тесті на пошук вразливостей, тоді як Gemini продемонструвала найгіршу ефективність.
1
113переглядів 1 Поширень