Operating system hardware resource optimization: Kernel hugepage tailoring for in memory applications

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Electrical Engineering | Master's thesis

Department

Mcode

Language

en

Pages

40

Series

Abstract

This thesis evaluates the potential of kernel hugepage tuning to improve TLB performance in a high-memory application under a single compute node. Currently little up-to-date research has been conducted into system tailoring for specific application profiles, leaving an opportunity for the development of new methodology. In tracking CPU events conducting an initial profiling of the high-memory compute application, several areas of impact are identified. These impact areas are used to inform assessment of effects caused by the varying of addressable page-sizes and their allocation through the Linux OS kernel. The best tailored approaches result in an application performance gain of 7.42% on average and 24.77% in niche conditions. A further untailored transparent hugepage approach yields 5.52%, reaching 6.23% with additional tailoring. The usage of hugepages as a runtime tunable for better application performance is found to be worth further study and should be considered in any high-memory use-case, when tuning a system.

Tämä diplomityö arvioi kernelitason laajaosoitesivujen säätämisen kykyä parantaa TLB-tehokkuutta korkeamuistisessa ohjelmistossa yhden laskentayksikön alla. Nykyisin vain vähän tutkimustyötä on tehty järjestelmien räätälöinnnissä valikoituihin sovellusprofiileihin, mikä tarjoaa tilaisuuden uusien menetelmien kehittämiseen. Seuraamalla tapahtumia tietokoneen suorittimessa ja alustavalla valikoidun korkeamuistisen laskentaohjelmiston profiloinnilla, huomataan useita vaikutuskohteita ohjelmistossa. Kohdealueita käytetään tukemaan osoitesivukokojen vaihtelun ja niiden käyttöjärjestelmän kautta tapahtuvan varaamisen vaihtelun tulkintaa. Näin havaittu parhaiten räätälöity ratkaisu tuottaa keskimäärin 7.42% nopeusparannuksen ja 24.77% parannuksen yksittäisellä tarkasteluvälillä. Myöhempi räätälöimätön Transparent Hugepage toteutus suoriutuu jopa 5.52% nopeammin, parantuen 6.23% lisäräätälöinnillä. Laajaosoitesivujen käyttö ajonaikaisena säätökohteena paremman ohjelmasuorituksen saavuttamiseksi huomattiin olevan lisätutkimuksen arvoista ja tulisi olla harkinnan alaista missä tahansa korkeamuistijärjestelmätapauksessta, kun järjestelmää räätälöidään tehokkaammaksi.

Description

Supervisor

Korpi-Lagg, Maarit

Thesis advisor

Lampi, Onni

Other note

Citation