作者 | ZeR0
編輯 | 漠影
芯東西12月27日報道,自研芯片技術已經是最佳化手機終端體驗的重要途徑。今日下午,OPPO亮出芯片調校技術的最新進展,首度公布其自研芯片軟硬融合技術棧關鍵的 潮汐架構 。
潮汐架構能有效解決影響SoC計算效率提升的存算分離、芯片排程兩大瓶頸:
1、對效能的最佳化深入到傳統手機廠商無法精細化的片上緩存系統,首次實作系統級緩存及L3緩存的動態匹配, 可將平均能效節約8% 。
2、精準動態排程SoC計算單元,使得 快手、高德地圖、微博、瀏覽器等套用均能效提升明顯 。
3、解決了影響系統流暢性的GPU控制顯示時延一致性難題, 讓安卓旗艦手機的啟動效能一致性體驗超越蘋果 。
除了潮汐架構外,面向安全私密,OPPO獨家VIP模式提供芯片級許可權加密,內建國密認證安全芯片,實作私密資訊獨立儲存、物理隔離。
此外,OPPO預告潮汐架構還會有重大升級, 將進一步拓展與聯發科的合作夥伴關系,深度參與下一代天璣旗艦芯片相關硬體的設計 。
一、緩存機制:精細化利用片上緩存,平均能效節約8%
OPPO軟體技術規劃與架構設計總監洪漢生說,做好芯片調校,需要兼具好的芯片和軟體能力。
當前SoC芯片計算效率提升困難有兩大瓶頸:1)智慧型手機效能鏈路沿用經典的馮·諾依曼式結構,存算分離,儲存讀寫速度遠低於CPU計算速度;2)芯片的排程方案缺乏場景級的認知。
對此,OPPO帶來自研的軟硬芯片融合技術棧—— 潮汐架構 。
據洪漢生分享,潮汐架構是OPPO在手機芯片調校領域鉆研多年的綜合成果。這些年,OPPO一直讓一些做系統軟體的工程師學習芯片技術,又招聘了大量的芯片設計工程師,讓他們理解軟體場景。所以潮汐架構是由一群 懂軟體、懂系統、懂芯片 的技術專家們共同打造出來的。
針對典型馮·諾依曼電腦體系結構普遍存在的存算分離問題,洪漢生認為, 緩存的使用是所有策略中最沒有副作用的、最有效的一個辦法 。
記憶體的金字塔,越往高處,速度越快。因為價格貴,所以上面幾層容量越來越小。越往下,因為成本優勢,容量能做的比較大。
相比記憶體儲存,緩存的讀寫速度優勢能達到10倍甚至百倍。如果讓數據讀取發生在金字塔上層,那麽整個計算鏈路的效率能得到很大提升。
用好緩存,有助於實作效能和功耗的兼顧。
OPPO過去幾年在這方面取得了進步。 相對傳統手機公司僅能在ROM或RAM進行效能最佳化,潮汐架構深入到了片上系統緩存及L3緩存。
「裏面的辛酸,可能只有我自己知道。」據洪漢生回憶,兩年前OPPO團隊決定做的時候,沒有仿真平台,更不要說程式碼或者開放介面,工程師們只能透過調整CPU、GPU、DDR的參數,改變投票策略,看緩存的命中和缺失,改一組數據就測一個結果,硬是用這種「笨辦法」,足足整理了一整年的數據,進行數據建模,看明白其中的規律和原理,從入門到精通,真正理解了技術。
然後,OPPO團隊與芯片廠商深入合作,成立效能和功耗的聯合實驗室,一起設計了從L3緩存到系統緩存的分區管理機制。
潮汐架構基於單場景去判斷當前套用對系統資源的需求,緩存能夠根據CPU和GPU進行動態配比,並使CPU、GPU等計算核心在最優頻點區間執行。如果是計算型任務占多,則主動分配更多緩存給CPU;如果渲染型任務占多,則將資源傾斜給GPU。
洪漢生說,這些方案看上去不復雜,但如果回到兩年前,「黑盒子」曾經就像一座大山一樣擋住了道路,不翻過去,永遠不會知道山的那邊是什麽樣子的,所幸OPPO團隊翻過了那座大山。
經測算, 在效能無失真的情況下,潮汐架構可實作8%的平均能效節約。
二、算力排程:動態排程SoC計算單元,明顯提升日常套用能效
下一個問題是芯片怎樣做算力排程。
電腦CPU有一個 甜點區間 ,在這個區間裏,能效比是最佳的;在這個區間外,有時候為了一點點的效能提升,要付出極大的功耗損失。
如果一個場景變得復雜,計算需求如何在多個計算單元裏以最低能耗執行?怎樣讓多個核心都處於這樣的甜點區間?這是一門復雜的學問。
據洪漢生透露,在OPPO新一代旗艦上,有1+2+3+2的架構,也有全大核的架構。
由OPPO與芯片廠商深度合作打造的潮汐架構, 透過對套用具體場景的準確辨識,精細化地進行場景排程分析和精準的算力功耗匹配,實作SoC計算單元的動態排程,讓計算單元更多地執行在最佳能效的甜點區間。
在跨平台的CPU頻率對映上,潮汐架構幫助避免了一些過度的算力消耗。
如圖是實測在多載遊戲下滿幀情況的一個頻點分布。可以看到,效能該釋放時,高頻點不吝嗇,但其他時候,其排程控制得非常精細,能夠把整個頻率能夠壓到非常低。
從其他常用的 快手、高德地圖、相簿、微博、瀏覽器 等各種頭部套用測試結果看,潮汐架構使其在SoC整體能耗上取得了 3%以上 的收益。
洪漢生解釋說,這些數據看起來不多,是因為芯片能效不是那麽容易提升的,而這些,都是真真實實的數據。
三、流暢性:讓安卓旗艦啟動效能一致性超越蘋果
除了能效外,潮汐架構還給安卓旗艦手機帶來了流暢性上的顯著進步。
洪漢生提到蘋果手機總是給人以更加流暢的意向。在他看來, 安卓手機的流暢性如果想要超越蘋果,最大的鴻溝就是「總是」這兩個字。
做一次流暢很容易,做百次、千次、萬次也不難,但是做到十萬次、百萬次,需要解決看不到的問題,要實作基本環節的體驗始終保持一致。
OPPO是怎麽做的?洪漢生分享說,日常使用手機點開一個套用,從點選那一刻到這個套用的圖示展開,區間大概是100多毫秒。經過長時間的分析,OPPO團隊發現要把它做流暢,可能比做一個遊戲120幀還要難。
這是因為有三個行業難題: 一是觸控響應一致性,二是軟體上的執行緒排程一致性,三是GPU顯示時延一致性。
跟GPU強相關的顯示時延一致性怎麽做呢?安卓手機采用的是分層次渲染,每一幀的動畫顯示都要經歷過多次軟體合成、硬體合成,會在GPU裏進進出出。如果說這是一條生產線,GPU就像是控制中台,必須有能力根據整個生產線上所有環節可能產生的任何偏差進行及時糾正,去動態增延長鐘訊號、動態增強GPU驅動能力,只有這樣,才能保證小到幾毫秒級別的時延,做到始終一致性。
否則,如果整個生產線錯過了一個時鐘訊號,就會導致整個工序往右移,會出現丟幀和延遲感,帶給終端使用者不好的體驗,比如點選圖示後沒有響應,整個頁面的顯示是姍姍來遲的。
在解決掉這三個問題後,OPPO參考了蘋果的設計,把響應時間調到了一個比較舒適的時間,不快也不慢,然後用高速攝影機反復進行測試,最後成功將整個套用的啟動響應時間控制得像蘋果那樣非常平穩。
透過精準的芯片算力排程,基於場景動態增強GPU驅動能力,潮汐架構 解決了影響系統流暢性的GPU控制顯示時延一致性難題 ,從而 保證了啟動效能的一致性 。
在模擬1天使用的320次套用啟動測試,OPPO Find X7以 低至11ms 的啟動響應標準差,做到了所有旗艦的 第一名 ,甚至 超越了以穩定流暢著稱的蘋果 。
四、國密二級認證安全芯片加持,實作硬體級安全加密
在保障使用者私密安全方面,OPPO致力於透過全鏈路的套用、數據管控和軟硬體結合的創新功能,已取得多項國內外安全私密領域頂級認證。
在今年10月釋出Find N3典藏版時,OPPO推出了行業首創的「VIP模式」,透過三段式物理開關,一鍵就能關閉麥克風、網路攝影機、定位等敏感許可權,為使用者私密進行硬體級安全加密。VIP模式也將登陸下一代Find X系列旗艦。
OPPO為「VIP模式」加持了一個透過手機領域最高認證等級的國密二級認證安全芯片。該芯片能夠獨立儲存各種敏感資訊,相比傳統的軟體安全方案,芯片級的加密方式可以將敏感許可權的管理、授權開關,與作業系統分離,鎖進安全芯片的硬體層,由芯片級安全子系統進行管理。
安全芯片配合通話私密雙向保護、私密資訊自動打碼、證件照片一鍵浮水印等私密功能,從硬體到一系列軟體功能,全方面守護使用者的私密安全。
結語:手機競爭卷向芯片調校
同一顆芯片,不同的芯片調校能力,影響了手機在實際使用中能夠發揮的芯片效能。
隨著莫耳定律瀕臨失效,每一代芯片制程提升,背後有行業千億級美元的投入、百萬級工程師的努力,也只能把芯片的整體能效提升百分之十幾。OPPO實作8%的平均能效節約,足見芯片調校對於最佳化能效表現的重要性。
在有限的芯片選擇中,透過軟硬體協同實作手機體驗差距的芯片調校能力競爭,已經從手機巨頭們之間暗戰轉化為台前「秀肌肉」的焦點。
這些終端使用者「看不見」的最佳化,拼得是不止是軟硬體技術實力,還考驗了手機大廠們的場景級認知、與芯片原廠合作深度等綜合能力。
隨著芯片調校愈發精細化,更高的效能、更優的能效,更穩定的流暢性,結合越來越多引入的智慧最佳化技術,最終將使使用者受益。