寒武纪发布全新AI训练GPU;小米智能开关零火版开启众筹

1.jpeg

原标题:寒武纪发布全新AI训练GPU;小米智能开关零火版开启众筹 【科技犬】

原标题:寒武纪发布全新AI训练GPU;小米智能开关零火版开启众筹

【科技犬】

3月21日,中国本土AI创新企业寒武纪正式发布了新款训练加速卡“MLU370-X8”,搭载双芯片四芯粒封装的思元370,集成寒武纪MLU-Link多芯互联技术,主要面向AI训练任务。

寒武纪MLU370-X8智能加速卡首次整合了双芯片四芯粒的思元370,也就是每张卡两颗芯片,每颗芯片内封装两个Die,因此可提供两倍于思元370加速卡的内存、编解码资源。

架构基于Cambricon MLUarch03,支持AI训练加速中常见的FP32、FP16、BF16、INT16、INT8、INT4数据格式计算,峰值性能分别为32TFlops、96TFlops、96TFlops、128Tops、256Tops、512Tops。

该卡采用7nm制造工艺,集成48GB LPDDR5内存,内存带宽614.4GB/s,PCIe 4.0 x16系统接口,整卡最大训练功耗250W,全高全长双插槽设计,系统被动散热。

单卡架构图

通过MLU-Link多芯互联技术,提供卡内、卡间互联功能,并专门设计了MLU-Link桥接卡,可实现4张加速卡为一组、8颗思元370芯片全互联。

每张加速卡通讯吞吐性能200GB/s,带宽为PCIe 4.0的大约3.1倍,可高效执行多芯多卡训练、分布式推理任务。

4卡桥接

单机8卡部署配置

4卡桥接拓扑

根据官方数据,Cambricon NeuWare SDK实测,在常见的4个深度学习网络模型上,MLU370-X8单卡性能与主流350W RTX GPU相当。

多卡加速,借助MLU-Link多芯互联技术、Cambricon NeuWare CNCL通讯库的优化,8卡环境下达到更优的并行加速比,YOLOv3、Transformer、BERT、ResNet101训练任务中,8卡并行平均性能达350W RTX GPU的155%。

单卡性能对比

8卡性能对比

小米智能开关零火版现已登陆小米商城众筹,将于3月23日上午10点开启众筹,众筹价89元起。

小米官方介绍,小米智能开关零火版有三大卖点:1、普通灯智能控、多种控制方式;2、丰富智能联动场景3、精工品质、手感干脆,回弹好。

有了小米智能开关零火版,用户就能轻松智能控制各式各样的灯具,包括吊灯、日光灯、射灯、壁灯、吸顶灯、灯棒等等,最高支持2200W功率。

它还支持小爱同学语音控制,再也不用费心记哪个开关对应哪个灯了,直接将每盏灯命名为你习惯的名字,联动小爱音箱,说句话就能开/关灯。

小米智能开关零火版还能联动人体传感器,开关灯全程无感;联动投影仪,灯光窗帘自动关闭;联动智能门锁,回家灯光和窗帘自动打开。

它还具备电量/功率统计功能,每日/月电量使用情况一目了然。其用料十足,接线端子采用黄铜镀金,经过8万次开关按压监测,经得起长久反复按压。返回搜狐,查看更多

责任编辑:

产品图.jpg

赞 (0)
上一篇 2024年11月22日 21:19
下一篇 2024年11月22日 21:19