GPT-5.5 очолила тест на пошук вразливостей, знайшовши вразливість у 7 з 10 спроб. DeepSeek V4 Pro показала нижчий результат, але була дешевшою. Claude моделі часто зупинялися через обмеження безпеки. Gemini здебільшого відмовлялася виконувати завдання. Експеримент не є офіційним бенчмарком. https://channeltech.space/ai/gpt-5-5-vulnerability-test-results/
GPT-5.5 очолила тест на пошук вразливостей, знайшовши вразливість у 7 з 10 спроб. DeepSeek V4 Pro показала нижчий результат, але була дешевшою. Claude моделі часто зупинялися через обмеження безпеки. Gemini здебільшого відмовлялася виконувати завдання. Експеримент не є офіційним бенчмарком. https://channeltech.space/ai/gpt-5-5-vulnerability-test-results/
114views
1
Shares