DeepSeek V3 — модель на основе смеси экспертов с 685B параметрами.
Дата релиза: 24.03.2025
Объем контекста: 128,000 токенов
Коэффициент расхода токенов: 2
Лучше всего
Креативное письмо
Повседневные задачи
Генерация кода
Ограничения
Сложные задачи
Исследовательская работа
Цепочки размышлений
Продвинутое программирование
Ошибки из-за большой нагрузки