使用场景
用于处理大规模AI模型训练和推理任务。
在数据中心中进行高效的数据流管理和分析。
在边缘计算设备中实现实时目标检测和语音处理。
产品特色
SiFive Matrix Engine:采用Fat Outer Product设计,与4个X-Cores紧密集成,深度融合向量单元。
4个X-Cores每个簇:每个具有双向量单元,执行所有其他层,例如激活函数,新增指数加速指令。
新的矩阵指令:由标量单元获取,源数据来自向量寄存器,目标为每个矩阵累加器。
1个簇=16 TOPS (INT8), 8 TFLOPS (BF16) 每个GHz。
每个XM系列簇提供1TB/s的持续带宽。
XM簇通过两种方式连接到内存:CHI端口用于一致性内存访问,高带宽端口连接到SRAM以存储模型数据。
主机CPU可以是RISC-V、x86或Arm(或不出现)。
系统可以通过CHI跨多个芯片扩展。
使用教程
1. 访问SiFive官网并下载SiFive Kernel Library。
2. 根据项目需求选择合适的XM系列配置。
3. 集成XM系列到现有的硬件或软件架构中。
4. 使用开源库加速开发过程。
5. 进行系统测试,确保性能满足预期。
6. 根据需要扩展系统,以适应更大规模的计算需求。
