内容纲要
20260622 周一
langgraph
20260623 周二
langgraph
20260624 周三
1、langgraph
2、鄱阳湖算力沟通会议
参会内容:就算力问题进行沟通,
参会人员:江西员工(试用模型之后,负责梳理后提出问题)、东莞总公司人员、九江电信负责人(负责解决问题)
目前算力状况:
昇腾910B服务器4台;一台服务器配8张64GB的910B显卡。单机512GB显存。共计32 * 64 =2048GB,也就是2TB的显存总量、
模型:deepseek v4 pro。现有算力刚好够部署一个模型
痛点&解决办法:
模型调用,生成速度慢,尤其是龙虾智能体接入之后,响应更慢
1)目前显卡的算力明显不够,直接的就是从4台扩充到8台,将显存扩充到两倍。
2)10月份可以换机群,从华为昇腾的910B到910C,效果是910B性能的三倍
试用期20天已经结束,但是还需要继续试用
1)试用结束,先支付费用,延长使用,但是可以按月或者按季度支付
技术方案对比,英伟达H100和华为昇腾AI显卡
3)九江有英伟达的显卡,也可以拿出来部署集群,方便对比英伟达和华为显卡的在部署技术的优劣势。
4)目前英伟达的卡,还做不到集群,但是后期可以做适配,技术实现上没有问题