Bitget App
Trading Inteligente
Comprar criptoMercadosTradingFuturosEarnCentroMás
El modelo DeepSeek-V3.2-Exp ha sido lanzado oficialmente y es de código abierto.

El modelo DeepSeek-V3.2-Exp ha sido lanzado oficialmente y es de código abierto.

ChaincatcherChaincatcher2025/09/29 10:17
Mostrar el original

ChainCatcher informa que el modelo DeepSeek-V3.2-Exp fue lanzado oficialmente y su código ha sido abierto hoy. El modelo introduce una arquitectura de Attention dispersa, la cual puede reducir eficazmente el consumo de recursos computacionales y mejorar la eficiencia de inferencia del modelo. Actualmente, este modelo ya está disponible en la plataforma MaaS (Model as a Service) de Huawei Cloud. Para el modelo DeepSeek-V3.2-Exp, Huawei Cloud sigue utilizando la solución de paralelismo EP a gran escala, implementando una estrategia de paralelismo contextual afinada para secuencias largas basada en la estructura de Attention dispersa, equilibrando tanto la latencia del modelo como el rendimiento de procesamiento.

0

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Haz staking y gana nuevos tokens.
APR de hasta 12%. Gana más airdrop bloqueando más.
¡Bloquea ahora!