Group Update and Relaxed Balance in Search Trees
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology |
Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Authors
Date
2000
Department
Major/Subject
Ohjelmistotekniikka
Mcode
Tik-106
Degree programme
Language
en
Pages
85
Series
Abstract
Tämä työ tarkastelee hakupuihin perustuvan indeksoinnin tehokuutta. Työ sisältää katsauksen perinteiseen puuindeksointiin sekä esittelee kaksi tunnettua tapaa parantaa indeksipuiden toimintaa. Työssä esitetään algoritmi eräälle binääripuuluokalle, jossa nämä kaksi strategiaa yhdistyvät. Algoritmia analysoidaan matemaattisesti ja sen tehokkuutta tutkitaan kokeellisesti yksinkertaistetun Java-toteutuksen avulla. Tapoja indeksoinnin tehostamiseen tarvitaan käsiteltävien tietomäärien kasvaessa. Esimerkiksi WWW-hakukoneet käsittävät nykyisellään yli miljardi dokumenttia. Lisäksi tietokantojen käyttäjämäärät ovat nopeassa kasvussa; hakutiheys kasvaa käyttäjäkunnan myötä. Perinteiset indeksihaut ja -päivitykset vaativat pitkiä kulkuja indeksipuussa sekä vaarantavat indeksin palvelutehon sulkemalla osia puusta vain omaan käyttöönsä. Indeksien tehokkaampaan käyttöön pyritään nykyisin kahdella uudistuksella. Ryhmäpäivityksessä päätavoitteena on vähentää tarvittavan puussa kulkemisen määrää indeksisolmujen paikallistamisen yhteydessä sekä helpottaa päivitysten läpivientiä. Toinen lähestymistapa liittyy puun tasapainon ylläpitoon; tämä ns. löyhä tasapainotus erottaa tasapainotusvaiheen päivityksestä pyrkien siten vähentämään operaatioiden poissulkevuutta puussa. Työssä esitetyn analyysin mukaan se myös vähentää tasapainotukseen tarvittavan laskennan määrää. Työssä kuvattu algoritmi yhdistää ryhmäpäivityksen ja löyhän tasapainotuksen ulkoisille binäärihakupuille. Algoritmianalyysi osoittaa, että verrattuna yksittäisiin tiukasti tasapainotettuihin operaatioihin, kompleksisuus on samaa tai pienempää luokkaa riippuen avainjakaumasta. Kokeelliset tulokset osoittavat ryhmäpäivityksen selvästi tehokkaammaksi, mutta tasapainotusmenettelyjen keskinäisiin suhteisiin ei tehdyillä kokeilla saatu varmistusta. Joskaan löyhän tasapainotuksen ei työssä todisteta tuovan säästöä työmäärässä, voidaan luotettavasti todeta sen olevan kompleksisuudeltaan lähellä tiukan tasapainotuksen suuruusluokkaa. Indeksioperaatioiden skeduloinnin sekä rinnakkaisen käytön vaatiman lukinnan kannalta löyhä tasapainotus on suotuisampi toimintatapa.Description
Supervisor
Soisalon-Soininen, EljasThesis advisor
Soisalon-Soininen, EljasKeywords
indexing, indeksointi, search tree, hakupuu, group update, ryhmäpäivitys, relaxed balancing, löyhä tasapainotus