充分考虑兼容需求的自主指令系统——龙架构(LoongArch™)

内容摘要:

龙芯中科基于二十年的CPU研制和生态建设积累推出了龙架构(LoongArch™),包括基础架构部分和向量指令、…


官网:https://www.loongson.cn/

充分考虑兼容需求的自主指令系统——龙架构(LoongArch™)插图

先进性:吸收近年来指令集发展的先进技术成果,提高代码效率

兼容性:融合X86、ARM等的主要特点,高效支持二进制翻译

模块化:基础部分、二进制翻译、虚拟化、向量化

扩展性:指令槽留有余地,利于今后的持续演进

2020年,龙芯中科基于二十年的CPU研制和生态建设积累推出了龙架构(LoongArch™),包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分,近2000条指令。

龙架构具有较好的自主性、先进性与兼容性。

龙架构从整个架构的顶层规划,到各部分的功能定义,再到细节上每条指令的编码、名称、含义,在架构上进行自主重新设计,具有充分的自主性。

龙架构摒弃了传统指令系统中部分不适应当前软硬件设计技术发展趋势的陈旧内容,吸纳了近年来指令系统设计领域诸多先进的技术发展成果。同原有兼容指令系统相比,不仅在硬件方面更易于高性能低功耗设计,而且在软件方面更易于编译优化和操作系统、虚拟机的开发。

龙架构在设计时充分考虑兼容生态需求,融合了各国际主流指令系统的主要功能特性,同时依托龙芯团队在二进制翻译方面十余年的技术积累创新,能够实现多种国际主流指令系统的高效二进制翻译。龙芯中科从 2020 年起新研的 CPU 均支持LoongArch™。

龙架构已得到国际开源软件界广泛认可与支持,正成为与X86/ARM并列的顶层开源生态系统。已向GNU组织申请到ELF Machine编号(258号),并获得Linux、Binutils、GDB、.NET、GCC、LLVM、Go、Chromium/V8、Mozilla / SpiderMonkey、FFmpeg、libyuv、libvpx、OpenH264、SRS等音视频类软件社区、UEFI(UEFI规范、ACPI规范)以及国内龙蜥开源社区、欧拉openEuler开源社区的支持。

指令系统是软件生态的起点,只有从指令系统的根源上实现自主,才能打破软件生态发展受制于人的锁链。龙架构的推出,是龙芯中科长期坚持自主研发理念的重要成果体现,是全面转向生态建设历史关头的重大技术跨越。

龙芯3A6000

龙芯3A6000是龙芯第四代微架构首款处理器,面向高端嵌入式计算机、桌面、服务器等应用。采用自主龙芯指令集(LoongArch™),基于全新研制的LA664处理器核,龙芯3A6000处理器性能在龙芯3A5000处理器基础上实现大幅提升,单核定/浮点性能分别提升60%和90%以上,多核定/浮点性能分别提升100%和90%。龙芯3A6000处理器 SPEC CPU 2006 Base单线程定/浮点分值分别达到46.1/57.7分,达到国际市场主流水平。

LS3A6000

产品参数

主频:2.0GHz-2.5GHz

峰值运算速度:240GFlops

物理核数:4

逻辑核数:8

处理器核:64位超标量处理器核LA664;支持LoongArch™指令系统;支持128/256位向量指令;六发射乱序执行;4个定点单元、4个向量单元和4个访存单元

高速缓存:每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存; 每个处理器核包含256KB私有二级缓存;所有处理器核共享16MB三级缓存

内存控制器:2个72位DDR4-3200控制器;支持ECC校验

高速I/O:1个HyperTransport 3.0控制器

其他I/O:1个SPI、1个UART、2个I2C、16个GPIO接口

封装:35mm×35mm BGA封装,1190个引脚

功耗管理:支持主要模块时钟动态关闭;支持主要时钟动态变频;支持主电压域动态调压

典型功耗:38W@2.5GHz

龙芯3C5000

面向服务器领域的通用处理器,片上集成16个高性能LA464处理器核,采用龙芯自主指令系统(LoongArch ®),在兼容龙芯3C5000L主板设计的基础上,调整优化了封装形式,保持了系统和应用软件的兼容性。

LS3C5000

产品参数

主频:2.0GHz – 2.2GHz

峰值运算速度:560GFlops@2.2GHz

核心个数:16

处理器核:64位超标量处理器核LA464; 支持LoongArch ®指令集; 支持128/256位向量指令; 四发射乱序执行; 4个定点单元、2个向量单元和2个访存单元

高速缓存:每个核包含64KB私有一级指令缓存和64KB私有一级数据缓存; 每个核包含256KB私有二级缓存; 共32MB三级缓存

内存接口:4个72位DDR4-3200; 支持ECC校验

高速I/O:1个HyperTransport 3.0 IO接口(HT0); 3个一致性互连高速接口(HT1、HT2、HT3)

其它I/O:1个SPI、1个UART、3个I2C、16个GPIO接口

功耗管理:支持主要模块时钟动态关闭;支持主要时钟域动态变频;支持主电压域动态调压

典型功耗:150W@2.2GHz

来源:

https://www.loongson.cn/product/show?id=15

https://www.loongson.cn/product/show?id=26

https://www.loongson.cn/system/loongarch