Durante la cuarta Exposición Internacional de Innovación Tecnológica BEYOND, el fundador de Biru Technology, Zhang Wen, compartió su opinión sobre los modelos de IA de gran escala. Zhang Wen señaló que la reducción de costos de los modelos de IA de gran escala puede lograrse desde tres aspectos: chips, sistemas y capacidades de clúster. "En cuanto a los chips, antes era necesario varios meses para entrenar un modelo de IA de gran escala, pero ahora, con el aumento de la potencia computacional de los chips y el aumento del ancho de banda, esto puede reducirse a unas pocas semanas. En el aspecto de los sistemas, es posible fusionar las arquitecturas de CPU, GPU y DPU en el futuro para mejorar las capacidades de los clústeres. Actualmente, los clústeres están funcionando cada vez mejor y la eficiencia de la potencia computacional ha mejorado significativamente".
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Durante la cuarta Exposición Internacional de Innovación Tecnológica BEYOND, el fundador de Biru Technology, Zhang Wen, compartió su opinión sobre los modelos de IA de gran escala. Zhang Wen señaló que la reducción de costos de los modelos de IA de gran escala puede lograrse desde tres aspectos: chips, sistemas y capacidades de clúster. "En cuanto a los chips, antes era necesario varios meses para entrenar un modelo de IA de gran escala, pero ahora, con el aumento de la potencia computacional de los chips y el aumento del ancho de banda, esto puede reducirse a unas pocas semanas. En el aspecto de los sistemas, es posible fusionar las arquitecturas de CPU, GPU y DPU en el futuro para mejorar las capacidades de los clústeres. Actualmente, los clústeres están funcionando cada vez mejor y la eficiencia de la potencia computacional ha mejorado significativamente".