A empresa de tecnologia BiRen fundada por Zhang Wen compartilhou sua visão sobre grandes modelos de IA na quarta exposição internacional de inovação tecnológica BEYOND. Zhang Wen afirmou que a redução de custos dos grandes modelos de IA pode ocorrer em três aspectos: chips, sistemas e capacidade de cluster. "No aspecto dos chips, antes era necessário meses para treinar um grande modelo de IA, mas agora, com o aumento da capacidade de computação dos chips, incluindo o aumento da largura de banda, esse período pode ser reduzido para algumas semanas. Em termos de sistemas, no futuro poderemos integrar as arquiteturas de CPU, GPU e DPU para melhorar a capacidade do sistema de cluster. Atualmente, os clusters estão se tornando cada vez melhores e a eficiência do poder de computação aumentou significativamente."
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
A empresa de tecnologia BiRen fundada por Zhang Wen compartilhou sua visão sobre grandes modelos de IA na quarta exposição internacional de inovação tecnológica BEYOND. Zhang Wen afirmou que a redução de custos dos grandes modelos de IA pode ocorrer em três aspectos: chips, sistemas e capacidade de cluster. "No aspecto dos chips, antes era necessário meses para treinar um grande modelo de IA, mas agora, com o aumento da capacidade de computação dos chips, incluindo o aumento da largura de banda, esse período pode ser reduzido para algumas semanas. Em termos de sistemas, no futuro poderemos integrar as arquiteturas de CPU, GPU e DPU para melhorar a capacidade do sistema de cluster. Atualmente, os clusters estão se tornando cada vez melhores e a eficiência do poder de computação aumentou significativamente."