miun.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Tolka musiktecken från bilder: Optisk musikigenkänning med maskininlärning
Mittuniversitetet, Fakulteten för naturvetenskap, teknik och medier, Avdelningen för informationssystem och -teknologi.
2018 (Svenska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
Abstract [en]

The objective of the project was to examine the possibility to use machine lear- ning without prior knowledge of machine learning or of mathematics and if that is possible also explore the possibility to use machine learning to interpret a picture of a piece of sheet music. The capacity of detecting notes from images of sheet music in the produced model was then compared to an existing pro- gram called Audiveris. The result became a model later used in a comparison with the program Audiveris. The comparison resulted in Audiveris finding al- most 100% of the notes but the new model only being able to detect about a third. The reasons for the big difference were probably: first that Audiveris has been in development for many years and secondly that the training data used for the new model wasn’t enough varied and complicated. To further increase the ability of the new model ́s skill the main point would be the need for more trai- ning data at the training of the model. Even then you need to supply a variation in the data ́s content and its degree of difficulty which is more varied then the first training data.

Abstract [sv]

Målet med projektet har varit att undersöka om det går att applicera maskininlärning utan att ha kunskaper av maskininlärning och matematik sedan tidigare samt om detta är möjligt också undersöka om det går att använda maskininlärning för att tolka en bild av nottecken för musik. Detta användes sedan för att jämföra dess förmåga att upptäcka noter med ett redan existerande program kallat Audiveris. Metoden som användes var att bilder märktes med information om dess innehåll och sedan användes dessa bilder för att träna en maskininlärningsmodell att tolka bilder av nottecken. Sedan gjordes en manuell jämförelse av Audiveris resultat samt resultatet från maskininlärningsmodellen efter att den tränats på de nya notbilderna. Resultatet blev en modell som sedan användes vid jämförelsen med Audiveris. Den jämförelsen resulterade i att Audiveris visade sig bättre än den nytränade modellen då Audiveris hittade nästan 100% av noterna på bilden medan den nya modellen bara hittade cirka 33.3%. Orsaken till den stora skillnaden på upptäckande av nottecken berodde antagligen till stor del på två saker: den första att Audiveris utvecklats under många år och den andra att träningsdatat som användes till den nya modellen inte var tillräckligt varierat och komplicerat. För att vidareutveckla den nya modellens färdighet skulle framför allt mer träningsdata behöva användas vid träningsmomentet. Även då behövde man se till att variationen av material och dess svårighetsgrad blev mer varierat än vid grundmaterialet.

Ort, förlag, år, upplaga, sidor
2018. , s. 28
Nyckelord [en]
TensorFlow, sheet music, OMR, Audiveris, machine learning
Nyckelord [sv]
TensorFlow, nottecken, OMR, Audiveris, maskininlärning
Nationell ämneskategori
Programvaruteknik
Identifikatorer
URN: urn:nbn:se:miun:diva-34063Arkivnummer: DT-V18-G3-010OAI: oai:DiVA.org:miun-34063DiVA, id: diva2:1229777
Ämne / kurs
Datateknik DT1
Utbildningsprogram
Datateknik TDATG 180 hp
Handledare
Examinatorer
Tillgänglig från: 2018-07-02 Skapad: 2018-07-02 Senast uppdaterad: 2018-07-02Bibliografiskt granskad

Open Access i DiVA

fulltext(549 kB)31 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 549 kBChecksumma SHA-512
9240e0f6baa82e1cf5c66fd59c334638164b5f40d6870e9902e4debb6a3b70210b3fa46250dd3d1d7cec995a6ca3e1a8c6f1aef77fb97e78157c467d3c3ec060
Typ fulltextMimetyp application/pdf

Sök vidare i DiVA

Av författaren/redaktören
Payerl, Anders
Av organisationen
Avdelningen för informationssystem och -teknologi
Programvaruteknik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 31 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 100 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf