Usage of machine learning in the analysis of pharmaceutical and health technology patent data

No Thumbnail Available

Files

URL

Journal Title

Journal ISSN

Volume Title

Sähkötekniikan korkeakoulu | Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.

Date

2024-12-08

Department

Major/Subject

Bioinformaatioteknologia

Mcode

ELEC3016

Degree programme

Sähkötekniikan kandidaattiohjelma

Language

en

Pages

17

Series

Abstract

Machine learning is a subset of artificial intelligence that allows computer systems to learn and make decisions based on input data. It offers new opportunities for analyzing patent data in the pharmaceutical and health technology sectors by accelerating the identification of innovations, improving resource allocation, and allowing the economic value of patents to be predicted more accurately and efficiently. This literature review examines key machine learning methods, such as deep learning, Latent Dirichlet Allocation (LDA), and Bidirectional Encoder Representations from Transformers (BERT), and their application to patent classification and text analysis. These methods provide an opportunity to examine the latent connections between patent texts and to analyze words and synonyms in patent texts. While machine learning offers numerous benefits, its development is limited by challenges such as the complexity of data processing and the lack of quality training materials. These constraints can reduce the accuracy and reliability of models. The work highlights that machine learning cannot fully replace expert analysis, but it can significantly speed up and improve the accuracy of analytical processes. The results suggest that increasing training data and developing deep learning methods will improve the accuracy and applicability of machine learning models. In the future, combining different machine learning methods could increase the accuracy and usefulness of patent analysis through applications. This could help to predict innovation and identify economic opportunities more effectively. In addition, the visualization of patent data through patent mapping could improve the understanding of technological opportunities and economic potential. Machine learning offers promising opportunities for patent analysis and could be a key tool for driving innovation in pharmaceutical and health technologies.

Koneoppiminen on tekoälyn osa-alue, joka mahdollistaa tietokonejärjestelmien oppimisen ja päätöksenteon syötetyn tiedon pohjalta. Se nopeuttaa innovaatioiden tunnistamista ja resurssien kohdentamista sekä parantaa patenttien taloudellisen arvon ennustamista. Tämä kirjallisuustutkimus tarkastelee keskeisiä koneoppimismenetelmiä, kuten syväoppimista, LDA-mallia (engl. Latent Dirichlet Allocation) ja BERT-mallia (engl. Bidirectional Encoder Representations from Transformers), sekä niiden soveltamista patenttien luokitteluun ja tekstianalyysiin. Nämä menetelmät tarjoavat mahdollisuuden tarkastella patenttien piileviä yhteyksiä tekstien välillä sekä sanojen ja synonyymien analysointia patenttiteksteissä. Vaikka koneoppiminen tarjoaa lukuisia hyötyjä, sen kehittämistä hankaloittavat haasteet, kuten datan käsittelyn monimutkaisuus ja laadukkaan koulutusmateriaalin puutteellisuus. Nämä rajoitteet voivat heikentää mallien tarkkuutta ja luotettavuutta. Työ korostaa, että koneoppiminen ei voi täysin korvata asiantuntijoiden arvioita, mutta se voi merkittävästi nopeuttaa ja tarkentaa analyysiprosesseja. Tulosten perusteella koulutusdatan lisääntyminen ja syväoppimismenetelmien kehittyminen parantavat koneoppimismallien tarkkuutta ja sovellettavuutta. Tulevaisuudessa erilaisten koneoppimismenetelmien yhdistäminen voisi lisätä patenttianalyysin tarkkuutta ja hyödyllisyyttä sovellusten avulla. Tämä voisi auttaa ennustamaan innovaatioita ja tunnistamaan taloudellisia mahdollisuuksia entistä tehokkaammin. Lisäksi patenttitiedon visualisointi, esimerkiksi patenttikartoituksen avulla, voisi parantaa ymmärrystä teknologisista mahdollisuuksista ja taloudellisesta potentiaalista. Koneoppiminen tarjoaa lupaavia mahdollisuuksia patenttianalyysille ja voi tulevaisuudessa olla keskeinen työkalu lääke- ja terveysteknologian innovaatioiden edistämisessä.

Description

Supervisor

Turunen, Markus

Thesis advisor

Varjo, Vivi

Keywords

machine learning, patent analysis, deep learning, health technology

Other note

Citation