3.1 龍芯3A1000
龍芯3A1000于2008年底交付流片,采用意法半導體的65nm工藝流片. 2009年5月20日龍芯3A1000晶圓生產下線,9月28日樣片回來,成功啟動操作系統,主頻800MHz-1GHz
龍芯3A1000進行了第一次改版并于2010年5月中旬流片,10月底第一次改版流片成功。3A1000的第二次改版于2012年2月下旬流片,2012年8月中旬流片成功。
龍芯3A1000集成了4個四發射亂序執行的GS464核,9級流水線,有64KB一級數據cache和64KB一級指令cache,4MB共享二級cache,最高主頻1GHz,功耗15w(支持動態降頻),芯片面積174mm2,晶體管數目4.25億。每個CPU核包含兩個浮點乘加部件,雙精度浮點性能峰值為16GFlops。在龍芯3A1000處理器中,實現了x86二進制翻譯加速指令。
3A100集成了HT1.0*2,PCI控制器、LPC、SPI、UART、GPIO。集成72位DDR2/3控制器,引腳1121個,封裝方式40mmx40mm FCBGA。
龍芯龍芯3A1000 01版本▲
龍芯龍芯3A1000 02版本▲
龍芯3A芯片版圖▲
圖片來源:中科院計算所2009年成果年報
3.2 龍芯3B1000
龍芯3B1000于2010年6月20日左右流片,2010年11月底回來第一批芯片
3B1000的第一次改版2011年2月初流片,7月初回來。龍芯3B1000進行了第二次改版,于2011年12月初流片,2012年4月底回來。
龍芯3B由核高基項目課題“高性能多核CPU研發與應用”支持,采用意法半導體65納米工藝設計,主頻1GHz,功耗25W,片內集成8個64位四發射亂序執行龍芯向量處理器核GS464V,4MB的二級cache,每個核包含兩個256位向量部件,峰值浮點性能達到128GFLOPS。。
龍芯3B的最大特色是龍芯向量處理器核的設計,該處理器核將GS464核的的浮點部件和浮點寄存器堆替換為2個256位的向量處理部件和1個128x256位的向量寄存器堆,使龍芯3B在1GHz下的峰值雙精度浮點計算能力達到128GFlops。在龍芯3B處理器中,實現了300多條專用的向量處理指令。
龍芯3B芯片面積300mm2,晶體管數目接近6億。
龍芯3B1000▲
龍芯3B1000芯片布局和向量核結構框圖▲
龍芯3B芯片布局▲
3.3 龍芯3B1500
龍芯3B1500在2012年1月中旬完成設計并交付流片。2012年8月底拿到樣片。后來,工藝從32nm遷移到28nm,于2013年4月底流片,10月底收到樣片,但流片并不成功,后來又恢復到32nm工藝流片,并以某種方式補償此次流片費用,于是又再次改版,于2015年1月底流片,2015年6月下旬收到樣片。
龍芯原本計劃推出一款16核的龍芯3C處理器,后來由于戰略調整,取消了原龍芯3C的研發,縮水成8核的龍芯3B1500。龍芯3B1500集成了8個四發射亂序執行的64位GS464V處理器核,9級流水線,每個處理器核有64KB的私有一級指令cache和64KB的私有一級數據cache,128KB私有二級cache,有8MB三級共享cache,采用中芯國際32納米工藝生產,芯片面積180mm2,晶體管數11億,主頻1.5GHz,采用倒裝焊球柵陣列(Flip-Chip BGA)封裝,芯片引腳數1121,封裝大小40mm×40mm。單芯片雙精度浮點計算能力達到192GFlops。功耗30w(典型)/60w(向量)。
在接口上,有HT2.0*2,PCI、LPC、SPI、UART、GPIO,72位DDR2/3控制器。
龍芯3B1500▲
龍芯3B1500版圖▲
3.4 龍芯3A2000/3B2000
龍芯3A2000于2014年11月初交付流片;2015年4月10日,拿到盲封樣片。2015年8月18日,龍芯召開發布會,正式發布新產品。2015年9月和2016年3月分別進行了第一次改版設計和第二次的改版設計。
龍芯3A2000處理器集成了4個四發射亂序執行64位GS464E處理器核,也是首款采用GS464E微結構的處理器。采用中芯國際40納米CMOS工藝生產,主頻800~1000MHz,在1GHz下SPEC CPU2006分數為6.9分。封裝方式FCBGA,1121引腳,封裝大小40mm×40mm。
GS464E處理器核是GS464的改進版,集成了64KB一級指令cache,64KB一級數據cache,256KB二級cache和4MB三級cache。特別需要指出的是,GS464E處理器核的stream性能有了大幅提升,單核STREAM性能達到6.3GB/s,是龍芯3A1000的20倍。流水線從GS464的9級提高到了12級。峰值浮點性能16GFlops。
在接口上,龍芯3A200集成了兩個HT3.0接口,PCI控制器、LPC、SPI、UART、GPIO,72位DDR2/3-1333×2控制器。
龍芯3A200A▲
龍芯3A2000B▲
GS464E微結構圖▲