his.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Machine Learning Agents: En undersökning om Curiosity som belöningssystem för maskininlärda agenter
University of Skövde, School of Informatics.
2019 (Swedish)Independent thesis Basic level (degree of Bachelor), 20 credits / 30 HE creditsStudent thesis
Abstract [sv]

Denna rapport har använt sig av Unity-verktyget ML-Agents till att bygga upp en spelmiljö där agenter tränats med hjälp av neurala nätverk och reinforcement learning. Miljön har utmanat agenterna med labyrintliknande banor där vissa även har enkla pusselmekaniker. Agenterna har sedan använts för att göra en undersökning om hur belöningssystemet Curiosity påverkar agentens förmåga att efter träning klara av för dem nya banor. Denna undersökning gjordes genom att träna 5 olika agenter under samma förhållanden där enbart styrkan på Curiosity-incitamentet skiljde dem åt. De olika Curiosity-styrkor som undersöktes var styrkorna: 0, 0.002, 0.033, 0.067 och 0.1. Dessa agenter utvärderades genom att spela igenom 8 utvärderingsbanor med varierande svårighetsgrad för att se vilken av agenterna som klarade av flest banor. Varje bana spelades igenom 50 gånger och antalet avklarade försök och tiden det tog för agenten att klara av varje bana antecknades.

Resultatet visade att samtliga agenter som tränats med Curiosity presterade betydligt bättre än agenten som tränats utan Curiosity. Antalet avklarade försök på utvärderingsbanorna ökade med 121%-231% då agenter tränades med Curiosity. Agenterna som tränats med Curiosity visade viss variation i hur bra de klarade av spelets banor. Den agent som presterade bäst var den med Curiosity-styrkan 0.002. Agenter som tränats med Curiosity visade sig mer benägna att undersöka banorna, vilket gjorde att de inte körde fast lika ofta som agenten som tränats utan Curiosity. Agenterna med Curiosity-styrkorna 0.033, 0.067 och 0.1 anses dock ha ett för högt värde på sin Curiosity-styrka då de uppvisat ett sämre resultat, samt ett rörelsemönster som anses icke-optimalt då de jämförs med agenten med Curiosity-styrkan 0.002. Överlag visade samtliga agenter en hög standardavvikelse, vilket innebär att det förekom hög varians försöken emellan.

Place, publisher, year, edition, pages
2019. , p. 92
Keywords [sv]
Maskininlärning, AI, curiosity, unity
National Category
Computer Sciences
Identifiers
URN: urn:nbn:se:his:diva-17114OAI: oai:DiVA.org:his-17114DiVA, id: diva2:1325282
Subject / course
Informationsteknologi
Educational program
Computer Game Development - Programming
Supervisors
Examiners
Available from: 2020-03-03 Created: 2019-06-15 Last updated: 2020-03-03Bibliographically approved

Open Access in DiVA

fulltext(1491 kB)0 downloads
File information
File name FULLTEXT01.pdfFile size 1491 kBChecksum SHA-512
8cddeacbc275800ba0827b8c68ef7887d9c029e0d122e545e8011c85cd4c92d006d3851f192f74c0438034631819d1eeebaa7e0a1c06cc04fbdef991a2099cf0
Type fulltextMimetype application/pdf

By organisation
School of Informatics
Computer Sciences

Search outside of DiVA

GoogleGoogle Scholar
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 2 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf