HWSW MOBIL normál verzió

Lehullott a lepel a Huawei GPU Turbo technológiájáról

Asztalos Olivér, 2018. szeptember 05. 14:12

Alaposan kivesézte a Huawei GPU Turbo technológiáját az AnandTech. A magazin mindenre kiterjedő elemzéséből kiderült, hogy a fejlesztés gépi tanulással optimalizálja az okostelefonban található erőforrásokat, amelynek hála számottevően növelhető a hatékonyság, illetve ezzel párhuzamosan minimális mértékben a megjelenítés tempója is. A mézes-mázos marketingbe csomagolt technológia gyakorlati haszna ugyanakkor köszönőviszonyban sincs a Huawei által kommunikált előrelépéssel, a tesztek alatt csupán a töredéknyi javulást mutatott ki a tesztoldal.

A Honor Play készülékkel júniusban bemutatkozott GPU Turbo a korábbi információkkal ellentétben nem a a renderelésre váró képkockákat manipulálja. Előzőleg ugyanis arról volt szó, hogy a technológia megkeresi azokat az elemeket, amelyek nem változtak a korábban megjelenített képkockákhoz képest, és jelzi a GPU felé, hogy azokat nem kell minden frame-en újra létrehozni, jelentős erőforrásokat spórolva meg a grafikus feldolgozó részéről. Ezzel szemben az AnandTech friss információi szerint a GPU Turbo gépi tanulásos eljárással optimalizálja a CPU és a GPU, illetve az azokhoz szorosan kapcsolódó erőforrások (pl. memória) kiosztását.

gpu_turbo_crazy

Érdekes részlet, hogy a gépi tanulásos következtetési (inferencing) folyamatot az okostelefonokban található Kirin rendszerchip gyorsítja. A 970-es processzorral debütált NPU-nak (Neural Processing Unit) hála a műveleteket (FP16) rendkívül hatékonyan képes végrehajtani a készülék, az ennél régebbi chipekkel szerelt modellek esetében viszont a CPU-ra kénytelen támaszkodni a szoftver, alacsonyabb hatékonyság mellett.

A TensorFlow neurális hálózati modellre épülő fejlesztés mögött több ezer óra valós és szimulált felhasználás áll, az ily módon begyűjtött adatokra alapozva próbálja precízen eltalálni a mindenkori leghatékonyabb erőforráskiosztást az energiamenedzsment. Az adatok begyűjtése során a DVFS, vagyis a feszültséget és órajelet szabályzó rendszer igyekszik kitapogatni az adott képkockához vagy jelenethez optimális beállításokat, azaz a legmagasabb megjelenítési tempót és az ahhoz elérhető legalacsonyabb disszipációt. Az AnandTech állítja, hogy a GPU Turbóval a másodpercenkénti 60 képkockás sebességet célozza a rendszer, amely ennek eléréséhez igazítja az egyes egységek órajelét és feszültségét.

A Huawei szoftvermérnökei ezzel egy nagyon fontos feladatra találtak kiváló megoldást: a modern rendszerlapkáknál, különösen a passzív hűtésű egységeknél erősen korlátozott a teljes chip energiafelvétele. Így jellemzően egy adott keretet kell kiosztani a különböző komponensek között úgy, hogy az elérhető legmagasabb teljesítményt tudja a rendszer elérni. Ez rendkívül nehéz feladat, notebookos környezetben is komoly kihívást jelent az egyre kifinomultabb energiamenedzsment-rendszerek fejlesztése, mobilon is komoly fejtörést okoz. Az igazi probléma, hogy folyamatosan változik, hogy melyik komponens épp a szűk keresztmetszet, ahol egységnyi fogyasztási keret "elköltése" jelentős gyorsulást hozna, miközben egy másik komponenstől ezt épp el lehet venni lassulás nélkül. És ahogy fentebb láttuk, az egyes processzormagok, a GPU, illetve a memóriavezérlő is éhes a hőkeretre, ezek között kell tehát egyensúlyozni.

huawei_ai

A technológia sajátosságai miatt minden egyes játékot külön-külön szükséges profilozni, sőt, az eltérő hardveres felépítés miatt minden egyes készülékmodellel külön kell lefuttatni a szimulációkat a Huawei-nek. Az összeállt rendszer esetében a készülék gyakorlatilag optimalizációs rétegként viselkedik az alkalmazás (játék), illetve a GPU közé, a renderelő futószalaghoz közel beékelődve. Feladata az adott képkockához tartozó mindenkori optimális feszültséget és órajel gyors és pontos adaptálása. Az sztenderd, úgynevezett reaktív DFVS esetében csupán a GPU terhelését monitorozza a rendszer, amely így kevésbé képes eltalálni a mindenkori legjobb passzoló beállításokat. Okostelefonoknál bőven van létjogosultsága hasonló megoldásoknak, hisz a készülékek jellemezően igencsak szűkös, néhány wattos fogyasztási keretből gazdálkodnak.

A technológia már említett egyik hátulütője, hogy minden egyes játék-készülék kombináció külön optimalizáció, illetve ennek megfelelő frissítést igényel. Ennek megfelelően mindeddig csupán két cím, a népszerű PUBG és a leginkább Kínában hódító Mobile Legends: Bang Bang kapta meg a szükséges beállítási pakkot. Ezen kettőhöz a Mate 20 bemutatója kapcsán csatlakozik majd az NBA 2K18, a Rules of Survival, az Arena of Valor, illetve a Vainglory.

Mit tud a gyakorlatban?

A technikai részletek mellett természetesen a GPU Turbo gyakorlati hasznát is górcső alá vette az AnandTech. A mérésekhez a közel hasonló hardverrel és szoftverrel rendelkező Huawei P20 és Honor Play készülékeket, illetve a PUBG-t hívta segítségül a magazin, előbbiben ugyanis még nem aktív a GPU Turbo, amely jó kiindulási alapot nyújtott a mérésekhez. Az említett játék mindkét készülék esetében 40 fps körüli megjelenítési tempót produkált, ergo számítási teljesítményben nem sok vizet zavart a hangzatos elnevezésű technológia. Fogyasztásban már más volt a helyzet, ugyanis míg a P20 4,7 wattot vett fel a játék futtatása során, addig a Honor Play beérte 3,9 wattal.

gpu_turbo_perf_comp

A különbség 15 százalék, amely bár a készülék akkus üzemidejében érezhető lehet, a Huawei hangzatos ígéreteivel köszönőviszonyban sincs. A gyártó ugyanis akár 60 százalékkal magasabb megjelenítési sebességgel és 30 százalékkal alacsonyabb fogyasztással kecsegtet, amelyek bár maximális értékek (up to), a joggal várható előrelépéstől rendkívül messze állnak. Ennek fényében nem is csoda, hogy a Kirin 980 múlt heti bemutatójának apropóján már a korábbinál sokkal visszafogottabb számokat közölt a cég, amely teljesítményben 1, hatékonyságban pedig 10 százalékos javulást mért legújabb alkalmazásprocesszorával, Előbbi bőven a mérési hibahatáron belül van, utóbbi pedig nem túl nagy előrelépés, vélhetően nem ezzel fogja vonzóbbá tenni készülékeit a Huawei.

Szólj hozzá >>

TwinCAT 3: gépi tanulás az automatizálás összes területén (x)

Tökéletesen integrált, nyílt és valós idejű gépi tanulás vezérlőrendszerekhez.

Tárolórendszerekben is sokat nyújt a Lenovo (x)

A nagyvállalati megoldásokban otthonosan mozgó gyártó széles storage kínálattal rendelkezik.