Understanding the Development of the AI Industry Through Patent-Based Keyword Networks
Loading...
URL
Journal Title
Journal ISSN
Volume Title
School of Science |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
Department
Major/Subject
Mcode
Language
en
Pages
73
Series
Abstract
Artificial intelligence(AI) has emerged as one of the most interesting and transformative industries of the 21st century which has seen rapid growth making it one of the most intriguing industries to analyze. This Master's thesis focuses on creating patent-based keyword networks to better understand the development of the AI industry. By focusing on relationships between keywords in the network this study aims to uncover temporal trends and patterns. Furthermore, the potential of integrating company-level data into the network to create a more informative network was evaluated. To achieve this, a careful selection of AI patents and AI patents related to AI was collected, covering the period from 1990 to 2023, followed up by a set of preprocessing steps to standardize the data. After this TF-IDF was used to identify the most important keywords for each patent. To create connections between these keywords a novel similarity metric was constructed, which balances keyword co-occurrence based on relative frequency. These networks were then visualized and analyzed to identify trends and shifts within the network. The analysis highlighted several significant trends within AI, the most significant of which was a clear development from core technologies closely related to AI into an increasingly broad range of applications and specialized fields. Furthermore, it was found that by incorporating company-level data into the patent-based keyword network resulted in a more holistic view of AI. Additionally, it was found that single-keyword networks provided a more granular perspective on how AI as a field has evolved compared to methods which cluster keywords together. Furthermore, single keywords were also found to be practical for temporal analysis as only their context changes over time. However, at the same time single keyword connections were harder to analyze as they could lack some of the required context. This limitation underscored the trade-off between granularity of the network and interpretability of them. In conclusion, this study demonstrated the utility of patent-based keyword networks for understanding how AI as field has been developed and the advantage of integrating company data into these networks.Tekoälystä on 2000-luvun aikana muodostunut yksi mielenkiintoisimmista ja maailmankuvaamme uudistavimmista toimialoista. Toimialana se on myös ollut todella nopean kasvun kohteena. Juuri nämä seikat tekevät siitä mielenkiintoisen tutkimuskohteen. Tämän diplomityön aiheena on selvittää, kuinka patenttien semanttisen sisällön perusteella voidaan rakentaa avainsanaverkkoja tekoälyn historiallisen kehityksen analysoimista varten. Tutkimalla avainsanojen välisiä yhteyksiä pyrimme löytämään alan kehitystrendejä. Informatiivisuuden lisäämiseksi työssä analysoitiin myös, kuinka yritystason sanastoa voidaan kytkeä patentteja koskevaan avainsanaverkostoon. Näiden tavoitteiden saavuttamiseksi analysoitiin tekoälypatenttien ja tekoälyyn liittyvien patenttien sisältöä ajanjaksolta 1990-2023. Analysointia varten patenteissa käytettyä sanastoa oli standardisoitava eri menetelmien avulla. Standardoinnin jälkeen hyödynnettiin TF-IDF menetelmää, jotta jokaisesta patentista kyettiin valitsemaan vain tärkeimmät avainsanat. Avainsanojen välisten yhteyksien luomiseksi kehitettiin uusi menetelmä, joka vertaa kuinka usein avainsanat löytyivät samasta patenttiotteesta suhteessa yleiseen esiintymistiheyteen. Näiden sanayhteyksien perusteella kyettiin luomaan avainsanaverkostoja, joiden visualisoinnilla voitiin analysoida alan historiallista kehitystä. Visualisointi havainnollisti, miten tekoäly on kehittynyt ajansaatossa yhä monipuolisemmaksi toimialaksi. Analyysista huomattiin myös, miten yritysdatan sisällyttäminen aineistoon loi kokonaisvaltaisemman verkoston. Lisäksi havaittiin miten yksittäisiin sanoihin perustuva verkosto antaa yksityiskohtaisemman näkymän tekoälystä, kuin verkosto missä avainsanat ryhmitetään. Tämän lisäksi yksittäisiin sanoihin perustuva verkosto voi olla käytännöllisempi alan kehityksen seuraamista varten, sillä vain sanojen väliset kontekstit muuttuvat. Kuitenkin tämäntyyppiset verkostot ovat vaikeampia analysoida sillä osa sanojen välisestä kontekstista puuttuu. Tämä eroavaisuus korostaa tätä kompromissia verkoston yksityiskohtaisuuden ja tulkittavuuden välillä. Tutkimus osoitti patenttipohjaisten avainsanaverkostojen hyödyllisyyden tekoälyä koskevan toimialan kehityksen ymmärtämisessä sekä yritysdatan integroinnin tuomat edut kehityksen analysoimisessa.Description
Supervisor
Holme, PetterThesis advisor
Holme, PetterKito, Tomomi