Дослідження The New York Times і Oumi виявило, що Google AI Overviews дає правильні відповіді лише у 90% випадків. Через масштаб пошуку це означає мільйони хибних відповідей на годину. Тестування проводилось на бенчмарку SimpleQA з 4 тисяч запитань; точність зросла з 85% до 91% після оновлення до Gemini 3. Google розкритикувала методологію дослідження й заявила, що SimpleQA не відображає реальних запитів користувачів. https://channeltech.space/ai/google-ai-overviews-accuracy-research/
Дослідження The New York Times і Oumi виявило, що Google AI Overviews дає правильні відповіді лише у 90% випадків. Через масштаб пошуку це означає мільйони хибних відповідей на годину. Тестування проводилось на бенчмарку SimpleQA з 4 тисяч запитань; точність зросла з 85% до 91% після оновлення до Gemini 3. Google розкритикувала методологію дослідження й заявила, що SimpleQA не відображає реальних запитів користувачів. https://channeltech.space/ai/google-ai-overviews-accuracy-research/
12переглядів
1
Поширень