芯片產(chǎn)業(yè)因其戰(zhàn)略重要性,一直在被重點(diǎn)關(guān)照。然而受制于近年來西方國家的一系列措施,我國芯片產(chǎn)業(yè)遭遇各方面壓制,授權(quán)禁令、供應(yīng)中斷等情況屢見不鮮,形成了俗稱的“卡脖子”現(xiàn)象。面對愈發(fā)嚴(yán)峻的環(huán)境挑戰(zhàn),國內(nèi)芯片企業(yè)始終無法突破關(guān)鍵核心技術(shù)的封鎖,不得不在已有的規(guī)則體系下謀求生存,然而這樣的策略僅僅是權(quán)宜之計。
芯片作為電子硬件的關(guān)鍵組件,其生產(chǎn)與設(shè)計涉及極高的技術(shù)難度。除了光刻機(jī)制造,芯片設(shè)計更是影響到產(chǎn)業(yè)發(fā)展的關(guān)鍵。要真正突破現(xiàn)有制約,自主芯片架構(gòu)是重中之重。現(xiàn)在桌面計算機(jī)以X86指令集架構(gòu)為主,移動端以ARM為主。當(dāng)前,國內(nèi)企業(yè)的芯片架構(gòu)發(fā)展多依賴于國外授權(quán),這使得我國芯片產(chǎn)業(yè)在遭遇斷供等問題時幾乎無法進(jìn)行有效應(yīng)對。因此,真正實(shí)現(xiàn)國產(chǎn)自主芯片,就必須突破底層指令系統(tǒng)的限制。
好消息目前國內(nèi)龍芯中科在芯片架構(gòu)方面已取得了零的突破,在2020年成功推出了全自主指令集龍架構(gòu)(LoongArch),標(biāo)志著國內(nèi)芯片正式擁有了自己的指令集架構(gòu)體系。
1 龍芯3A6000介紹
在2020年發(fā)布了LoongArch自主指令集架構(gòu)后,龍芯中科也基于LoongArch架構(gòu)的處理器3A 5000系列處理器成功流片,而經(jīng)過了三年左右的發(fā)展,龍芯3A6000在今年也正式流片發(fā)布。
龍芯3A6000處理器依舊采用LoongArch自主指令集架構(gòu),與3A5000處理器使用了相同的12nm工藝,但通過架構(gòu)優(yōu)化設(shè)計,定點(diǎn)和浮點(diǎn)分?jǐn)?shù)大幅提升。龍芯3A6000處理器內(nèi)核從龍芯3A5000的LA464升級到了LA664,名字664代表6發(fā)射64位,每個龍芯3A6000處理器有4個LA664核心,支持128位向量處理擴(kuò)展指令(LSX)和256位高級向量處理擴(kuò)展指令(LASX)。
上一代龍芯3A5000處理器擁有4核心,而龍芯3A6000處理器首次支持同步多線程技術(shù)(SMT2),原理就是大家熟知的超線程,從而讓龍芯3A6000處理器核心線程達(dá)到了4核心8線程。頻率的話龍芯3A6000處理器跟上代3A5000一樣,依舊是2.5Ghz的主頻。三級緩存為16MB,內(nèi)部集成了雙通道DDR4-3200內(nèi)存控制器。
這次我們也拿到了搭載龍芯3A6000的臺式機(jī),這次龍芯3A6000依舊是焊接封裝在主板上,主機(jī)內(nèi)部提供了雙8GB 3200MHz內(nèi)存,256GB的固態(tài)硬盤以及RX 580顯卡,搭載的系統(tǒng)為統(tǒng)信UOS。目前的統(tǒng)信UOS和LoongArch架構(gòu)已經(jīng)適配了絕大部分辦公軟件,相較于龍芯3A5000時期只有零散軟件生態(tài)現(xiàn)在真是壯大了不少,作為一臺日用辦公主機(jī),在軟件上的支持足夠滿足大部分用戶的需求了。
此前根據(jù)中國電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室在龍芯3A6000流片時進(jìn)行過測試,根據(jù)測試結(jié)果顯示龍芯3A6000處理器總體性能與Intel公司2020年上市的第10代酷睿四核處理器相當(dāng)。所以這次測試時我們會用英特爾酷睿i3-10105來進(jìn)行一下對比,同時加入AMD 銳龍3 3100這款三代銳龍?zhí)幚砥鞯某煽?,三款處理器的基本參?shù)如下。
單說參數(shù),龍芯3A6000處理器除了在頻率上具有劣勢外,其余的參數(shù)確實(shí)已經(jīng)追上了這些三年前的英特爾和AMD入門級處理器,至于性能差異有多少,是否真能與英特爾酷睿i3-10105這款10代4核8線程處理器性能相當(dāng),下面我們就來看一下實(shí)測成績,我們這次主要通過基準(zhǔn)測試和實(shí)際體驗(yàn)方面來進(jìn)行對比,測試平臺均采用相同版本的統(tǒng)信UOS系統(tǒng),除了主板和CPU外其余硬件配置一模一樣。
2 基準(zhǔn)測試
Unixbench測試:
首先來看一下在基準(zhǔn)測試中,我們會使用三款測試軟件:SPEC CPU 2006、 Stream、Unixbench來進(jìn)行測試。首先使用UnixBench來進(jìn)行測試。這款軟件是一個類 Unix(Unix,BSD,Linux)系統(tǒng)下的性能測試工具,被廣泛用于測試 Linux 系統(tǒng)主機(jī)的性能??梢詼y試系統(tǒng)調(diào)用、讀寫、進(jìn)程、圖形化測試等成績,也是一個全方面考驗(yàn)整機(jī)的軟件。
UnixBench的測試結(jié)果顯示龍芯3A6000處理器多線程成績?yōu)?507.1,單線程成績?yōu)?822.7。英特爾酷睿i3-10105單核心分?jǐn)?shù)2423.1,多核心分?jǐn)?shù)為2423.1。 AMD 銳龍3 3100單核心分?jǐn)?shù)2938.2,多核心分?jǐn)?shù)10169。從測試結(jié)果可以看到,龍芯3A6000處理器在Unixbench的多核心性能上比英特爾酷睿i3-10105表現(xiàn)更出色,單核則還有一定的差距。
SPEC CPU 2006:
接下來我們進(jìn)行SPEC 2006對比測試,SPEC 2006是一個大型的CPU性能測試項(xiàng)目,重點(diǎn)測試系統(tǒng)的處理器,內(nèi)存子系統(tǒng)和編譯器。能夠測試CPU最基礎(chǔ)的定點(diǎn)性能int和浮點(diǎn)性能fp。
根據(jù)測試結(jié)果顯示,龍芯3A6000處理器在SPEC2006中單線程定點(diǎn)性能int成績?yōu)?3,單線程浮點(diǎn)性能fp成績?yōu)?4.7,英特爾酷睿i3-10105單線程定點(diǎn)性能int成績?yōu)?9,單線程浮點(diǎn)性能fp成績?yōu)?6.7。AMD 銳龍3 3100單核心分?jǐn)?shù)41.1,單線程浮點(diǎn)性能fp成績?yōu)?7.3。在這項(xiàng)測試中,龍芯3A6000處理器不管是定點(diǎn)性能int還是浮點(diǎn)性能fp都要強(qiáng)于英特爾酷睿i3-10105,而單線程定點(diǎn)性能int甚至也能超越AMD 銳龍3 3100一點(diǎn)。
多線程測試中,龍芯3A6000處理器在SPEC2006中多線程定點(diǎn)性能int成績?yōu)?39,多線程浮點(diǎn)性能fp成績?yōu)?53,英特爾酷睿i3-10105多線程定點(diǎn)性能int成績?yōu)?5.8,多線程浮點(diǎn)性能fp成績?yōu)?01。 銳龍3 3100多線程分?jǐn)?shù)133,多線程浮點(diǎn)性能fp成績?yōu)?54。龍芯3A6000在多線程測試中定點(diǎn)性能int超過了英特爾酷睿i3-10105和AMD銳龍3 3100,浮點(diǎn)性能fp與AMD 銳龍3 3100之只差1。
Stream:
Stream是業(yè)界主流的內(nèi)存帶寬測試程序,測試行為相對簡單可控。 該程序?qū)PU的計算能力要求很小,對CPU內(nèi)存帶寬壓力很大。 隨著處理器核心數(shù)量的增大,而內(nèi)存帶寬并沒有隨之成線性增長,因此內(nèi)存帶寬對提升多核心的處理能力就越發(fā)重要。
我們分別測試了單線程、4線程以及8線程的在Stream成績,其中龍芯3A6000在這款軟件中成績表現(xiàn)都很突出,成績均超過了兩款英特爾和AMD處理器。特別是單線程成績,除了Scale模式外,成績分?jǐn)?shù)都是表現(xiàn)最好的,說明這代龍芯3A6000在單線程優(yōu)化方面做得更出色一些。而在前兩項(xiàng)測試中表現(xiàn)突出的AMD 銳龍3 3100,在Stream測試中遇到了瓶頸,這也比較符合當(dāng)時銳龍?zhí)幚砥鞯谋憩F(xiàn),在內(nèi)存方面一直要差一些。
基準(zhǔn)測試性能上,龍芯3A6000對比英特爾酷睿i3-10105整體來說確實(shí)更有優(yōu)勢,甚至SPEC 2006和Stream這種測試軟件也要比AMD 銳龍3 3100更有優(yōu)勢,這些軟件在統(tǒng)信UOS系統(tǒng)能讓國產(chǎn)處理器性能發(fā)揮更出色,這也是生態(tài)系統(tǒng)的重要性,生態(tài)建立到位才能讓處理器發(fā)揮出更強(qiáng)的性能。
3 應(yīng)用測試
除了上面三款基準(zhǔn)測試軟件,我們也下面實(shí)測一下龍芯3A6000在常用辦公軟件上的性能表現(xiàn)。
WPS文檔:
然后我們首先使用WPS分別打開50MB和200MB文檔, 并記錄文檔打開的是時間,為了保證測試數(shù)據(jù)更加精準(zhǔn),我們每個文檔會打開3次平均值。
通過實(shí)際測試可以看到,龍芯3A6000在打開50MB文檔的時候用時最短,只用了0.8s,而200MB的文檔用時最長,需要2.12s,但也十分接近英特爾酷睿i3-10105,整體來看在處理小容量文檔時龍芯3A6000具有更大的優(yōu)勢。
WPS PPT:
下面我們在用PPT來測試一下,分別打開50MB的PPT,一個PPT包含圖片+視頻,一個包含文字+圖片,同樣每個PPT會打開3次平均值。
龍芯3A6000在打開50MB文字+圖片的PPT用時1.68s,打開圖片+視頻的50MB PPT用時1.8s。AMD 銳龍3 3100打開50MB文字+圖片的PPT用時1.54s,打開圖片+視頻的50MB PPT用時1.56s。英特爾酷睿i3-10105打開50MB文字+圖片的PPT用時1.14s,打開圖片+視頻的50MB PPT用時1.32s。PPT打開測試中龍芯3A6000是三款處理器里耗時最多的。
WPS Excel:
接下來測試一下Excel表格的打開速度,分別打開50MB純文字表格和50MB文字+圖片的表格,每個表格會打開3次平均值。
WPS Excel打開測試中,龍芯3A6000打開50MB純文字的表格用時2.61s,打開50MB的文字+圖片表格用時3.15s,AMD 銳龍3 3100打開50MB純文字的表格用時2.01s,打開50MB的文字+圖片表格用時2.35s。英特爾酷睿i3-10105打開50MB純文字的表格用時2.74s,打開50MB的文字+圖片表格用時3.21s。這項(xiàng)測試中龍芯3A6000雖然打開速度不如AMD 銳龍3 3100,但耗時要比英特爾酷睿i3-10105更短。
影音打開:
最后我們再來測試一下影音播放的打開速度,我們選擇統(tǒng)信UOS操作系統(tǒng)下的默認(rèn)視頻播放器,并打開同樣大小的4K和1080P mp4格式的視頻,分別記錄三個平臺的打開時間,同時每個視頻會打開3次平均值。
根據(jù)測試結(jié)果顯示,龍芯3A6000處理器打開4K視頻用時1.23s,打開1080視頻用時1.19s。AMD 銳龍3 3100打開4K視頻用時1.42s,打開1080視頻用時1.27s。英特爾酷睿i3-10105打開4K視頻用時1.67s,打開1080視頻用時1.37s。在這三款處理器中龍芯3A6000處理器耗時最短。
4 游戲體驗(yàn)
這次令人驚喜的是,龍芯3A6000可以玩游戲了,比如《死亡細(xì)胞》、《火炬之光》以及老版本的《古墓麗影》,甚至龍芯還給《魔獸世界懷舊服》做了適配,但可惜暴雪已經(jīng)推出大陸市場,所以沒法進(jìn)行體驗(yàn)。
游戲方面,在適配的幾個游戲中,龍芯3A6000已經(jīng)能夠做到相對流暢的進(jìn)行游玩,比如《死亡細(xì)胞》,全程體驗(yàn)都很順滑,也沒有遇到閃退、死機(jī)等不良反映。
《火炬之光》時感覺幀數(shù)預(yù)計在40幀左右,相較于《死亡細(xì)胞》幀數(shù)會低一些,但也能流暢運(yùn)行,不過測試時候也發(fā)現(xiàn)《火炬之光》的8個核心是沒有吃滿的,利用率不高,在多線程方面,還需要進(jìn)一步的優(yōu)化,不過已經(jīng)能玩了,相信這一天也不會太遠(yuǎn)。
5 新的突破 新的挑戰(zhàn)
龍芯3A6000的發(fā)布無疑是一個里程碑,通過LoongArch自主指令集架構(gòu)和SMT同步多線程以及多方面優(yōu)化,這款處理器已經(jīng)取得了一系列突破,實(shí)測結(jié)果也能證明,不管是基準(zhǔn)測試還是辦公體驗(yàn),龍芯3A6000在統(tǒng)信UOS系統(tǒng)上的發(fā)揮已經(jīng)媲美甚至部分超越了英特爾酷睿i3-10105,將國產(chǎn)自研芯片性能提升到了一個高度,重要的是這是在自主可控的完全國產(chǎn)指令集架構(gòu)上完成的成就。當(dāng)然龍芯3A6000目前仍有一些問題存在,比如測試時發(fā)現(xiàn)多線程仍需優(yōu)化,核心利用率不高,以及在軟件兼容體驗(yàn)上相仍有很大的進(jìn)步空間,這些都是未來需要努力的方向。
目前LoongArch和國產(chǎn)系統(tǒng)的市場接受度也需要時間和資源去推動。在全球產(chǎn)業(yè)鏈日趨復(fù)雜的今天,一個完整的半導(dǎo)體生態(tài)系統(tǒng)并不是依靠單一企業(yè)或單一產(chǎn)品就能建立起來的。它需要供應(yīng)鏈的完善、軟件生態(tài)的豐富,以及應(yīng)用場景的拓展。這必然是一個長期、艱苦的過程。不可能一蹴而就,它需要穩(wěn)定的資金投入、持續(xù)的人才儲備、先進(jìn)的研發(fā)。
再者,技術(shù)快速發(fā)展的背景下,競爭同樣在加速。全球芯片巨頭不斷推陳出新,采用更先進(jìn)的生產(chǎn)工藝和設(shè)計方法,如7nm、5nm甚至更先進(jìn)。為了不被迅速落后,國內(nèi)廠商必須加速研發(fā)步伐,投入更多資源,并且在全球范圍內(nèi)拓展技術(shù)合作和人才引進(jìn)。
半導(dǎo)體產(chǎn)業(yè)是一個高度集成復(fù)雜領(lǐng)域,每一個小進(jìn)步都可能帶來巨大的突破。我們有理由相信,隨著國內(nèi)外各方面的共同努力,國產(chǎn)芯片將不僅僅是一種“替代品”,而是在全球范圍內(nèi)具有競爭力和影響力的“主角”。但這一切都需要時間、資金和耐心。LoongArch自主指令集架構(gòu)已經(jīng)為完全可控自主的國產(chǎn)芯片搭好橋梁,龍芯3A6000在國產(chǎn)芯片商業(yè)化上邁出新一步,而等待國產(chǎn)芯片產(chǎn)業(yè)的全面崛起,必將是一個漫長且值得期待的過程。