The Effect of Circuit Structure on the Expressiveness of Quantum Neural Networks

Loading...
Thumbnail Image

Files

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.

Department

Major/Subject

Mcode

SCI3103

Language

en

Pages

32

Series

Abstract

As continuous advances are made in quantum computing, quantum machine learning has risen to be a prominent research area. Variational quantum algorithms, and especially their subgroup of quantum neural networks (QNNs), have emerged as promising approaches for real-life applications. Mathematically, any QNN can be presented as a partial Fourier-type series, whose terms are determined by a parametrized quantum circuit (PQC) specific to the model. Although the Fourier coefficients in this series play a pivotal role in determining the expressiveness of the model, little research has been conducted on the manner in which their values are formed. This thesis examines the coefficient distributions produced by simulating simple PQC structures, mapping and comparing any phenomena in the values of the Fourier coefficients, which notably restrict the expressiveness of the corresponding QNNs. The main focus of comparison are circuits of different shapes, but which yield the same frequencies. In addition, this thesis aims to connect distributions of coefficients displaying the same phenomena to elements in the underlying parametrized quantum circuits. This thesis investigated small QNNs, where the rotations in their data encoding and weight training blocks were chosen to be either Pauli-X, -Y, or -Z rotations. The measurement observable was chosen as the Pauli-X, -Y or -Z operator on the first qubit. For each circuit, all data encoding layers were identical amongst themselves and all weight training blocks implemented the same entangling subroutine in all their inner layers. Common factors were found in circuit structures, which restricted the corresponding model to a simple sine or a constant-valued function. The coefficients being restricted to only real or imaginary values, which further allows for writing the model as a series of cosines or sines, respectively, was found to be a common phenomena. It was also determined that the amount of inner layers in the training blocks can fundamentally alter the resulting coefficients for some circuits. However, this layer count did not seem to affect any of the distributions produced by one-qubit models. Commonly appearing differences and similarities were also found for PQCs of different shapes with the same frequency spectra. For example, patterns dependant on the parities of different factors were more frequent in models with at least two qubits.

Kvanttilaskennan jatkuvan kehityksen myötä kvanttikoneoppiminen on noussut näkyväksi tutkimusalueeksi. Variaatioalgoritmit, ja erityisesti niihin lukeutuvat kvanttineuroverkot, ovat osoittautuneet lupaaviksi käytännön sovelluksien saralla. Jokainen kvanttineuroverkko voidaan esittää Fourier’n sarjan kaltaisena sarjana, jonka termit määräytyvät mallin parametrisoidusta kvanttipiiristä. Vaikka sarjan Fourier’n kertoimet ovat olennaisia mallin ilmaisuvoiman (engl. expressiveness) määrittämisessä, tutkimustieto siitä, kuinka niiden arvot muodostuvat, on toistaiseksi vähäistä. Tämä kandidaatintyö tutkii simuloimalla yksinkertaisten parametrisoitujen kvanttipiirirakenteiden muodostamia kerroinjakaumia. Työssä kartoitetaan ja vertaillaan Fourier’n kertoimien arvoissa esiintyviä ilmiöitä, jotka olennaisesti rajoittavat vastaavien kvanttineuroverkkojen ilmaisuvoimaa. Vertailun keskiössä ovat erimuotoiset mutta tuottamiltaan taajuuksilta yhtenevät kvanttipiirit. Lisäksi työssä pyritään määrittämään yhteisiä tekijöitä niiden mallien piirielementeissä, joiden tuottamissa kertoimissa havaitaan samoja ilmiöitä. Työssä tarkasteltiin pieniä kvanttineuroverkkoja, joissa datan koodauksessa ja painoparametrien optimoimisessa käytetiin Pauli-X, -Y ja -Z -käännöksiä. Mittauksen observaabeliksi valittiin Pauli-X, -Y tai -Z -operaattori ensimmäisen kubitin suhteen. Jokaisessa simuloidussa piirissä kaikki datakoodausta toteuttavat kerrokset olivat keskenään samanlaisia, ja painoparametreista riippuvat osapiirit toteuttivat saman lomittumisrutiinin jokaisessa sisäisessä kerroksessaan. Simulaatioiden perusteella onnistuttiin määrittämään yhteisiä elementtejä sellaisista piireistä, jotka rajoittivat vastaavan mallin sinimuotoiseksi tai vakioarvoiseksi funktioksi. Yleiseksi ilmiöksi todettiin kaikkien kertoimien rajoittuminen vain reaalisiin tai imaginaarisiin arvoihin, mikä mahdollistaa funktion esittämisen vastaavasti kosini- tai sinifunktioiden summana. Painoparametreistä riippuvien osapiirien sisäisten kerroksien määrän havaittiin myös voivan perustavanlaatuisesti muuttaa muodostuvia jakaumia. Tosin kerrosten määrällä ei ollut huomattavaa vaikutusta missään vain yhden kubitin sisältävässä mallissa. Saman taajuusspektrin tuottavista, mutta muodoltaan erilaisista piireistä, tunnistettiin myös muita tyypillisiä eroja ja yhtäläisyyksiä. Esimerkiksi eri tekijöiden parillisuudesta riippuvat ilmiöt olivat yleisempiä malleissa, joissa kubitteja oli vähintään kaksi.

Description

Supervisor

Raasakka, Matti

Thesis advisor

Ylinen, Lauri

Other note

Citation