#технології
DeepSeek дропнули нову V3.2-Exp — і це чиста імба.
Китайці знову здивували: їхня свіжа модель отримала технологію розподіленої уваги, завдяки якій:
• довгі тексти обробляються у 64 рази швидше;
• споживання пам’яті падає на 30–40%;
• навчання стає ефективнішим на 50%.
Розумне використання ресурсів дозволяє моделі вже зараз конкурувати з топовими гравцями ринку.
https://www.wsj.com/tech/ai/chinas-deepseek-unveils-new-ai-model-that...
DeepSeek дропнули нову V3.2-Exp — і це чиста імба.
Китайці знову здивували: їхня свіжа модель отримала технологію розподіленої уваги, завдяки якій:
• довгі тексти обробляються у 64 рази швидше;
• споживання пам’яті падає на 30–40%;
• навчання стає ефективнішим на 50%.
Розумне використання ресурсів дозволяє моделі вже зараз конкурувати з топовими гравцями ринку.
https://www.wsj.com/tech/ai/chinas-deepseek-unveils-new-ai-model-that...
#технології
DeepSeek дропнули нову V3.2-Exp — і це чиста імба.
Китайці знову здивували: їхня свіжа модель отримала технологію розподіленої уваги, завдяки якій:
• довгі тексти обробляються у 64 рази швидше;
• споживання пам’яті падає на 30–40%;
• навчання стає ефективнішим на 50%.
Розумне використання ресурсів дозволяє моделі вже зараз конкурувати з топовими гравцями ринку.
https://www.wsj.com/tech/ai/chinas-deepseek-unveils-new-ai-model-that-could-halve-usage-cost-785facc2

23переглядів