#технології
DeepSeek дропнули нову V3.2-Exp — і це чиста імба.
Китайці знову здивували: їхня свіжа модель отримала технологію розподіленої уваги, завдяки якій:

• довгі тексти обробляються у 64 рази швидше;
• споживання пам’яті падає на 30–40%;
• навчання стає ефективнішим на 50%.

Розумне використання ресурсів дозволяє моделі вже зараз конкурувати з топовими гравцями ринку.
https://www.wsj.com/tech/ai/chinas-deepseek-unveils-new-ai-model-that...
#технології DeepSeek дропнули нову V3.2-Exp — і це чиста імба. Китайці знову здивували: їхня свіжа модель отримала технологію розподіленої уваги, завдяки якій: • довгі тексти обробляються у 64 рази швидше; • споживання пам’яті падає на 30–40%; • навчання стає ефективнішим на 50%. Розумне використання ресурсів дозволяє моделі вже зараз конкурувати з топовими гравцями ринку. https://www.wsj.com/tech/ai/chinas-deepseek-unveils-new-ai-model-that-could-halve-usage-cost-785facc2
Like
1
23переглядів