(原标题:云天励飞:IPU-X6000加速卡已适配超过30个开源大模型,预期能使大模型推理成本大幅度下降)
经济观察网讯 7月24日,云天励飞在上证e互动平台表示,公司2024年推出的IPU-X6000加速卡主要用于大模型云端推理,其内置高效大模型推理DeepEdge200芯片,具有256T大算力、486GB/s超高带宽、128GB大显存、c2c mesh互联,可应用于语言大模型、视觉大模型、多模态大模型等各类大模型推理加速领域。目前已经支持适配云天书、通义千问、百川智能、智谱清言、Meta等30+开源大模型,涵盖1.5B参数到70B参数量,预期能使大模型推理成本大幅度下降。(实习记者 李青阳 编辑 李仕静)