his.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
A comparative study of social bot classification techniques
Högskolan i Skövde, Institutionen för informationsteknologi.
Högskolan i Skövde, Institutionen för informationsteknologi.
Högskolan i Skövde, Institutionen för informationsteknologi.
2019 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)
Abstract [en]

With social media rising in popularity over the recent years, new so called social bots are infiltrating by spamming and manipulating people all over the world. Many different methods have been presented to solve this problem with varying success. This study aims to compare some of these methods, on a dataset of Twitter account metadata, to provide helpful information to companies when deciding how to solve this problem. Two machine learning algorithms and a human survey will be compared on the ability to classify accounts. The algorithms used are the supervised algorithm random forest and the unsupervised algorithm k-means. There will also be an evaluation of two ways to run these algorithms, using the machine learning as a service BigML and the python library Scikit-learn. Additionally, what metadata features are most valuable in the supervised and human survey will be compared. Results show that supervised machine learning is the superior technique for social bot identification with an accuracy of almost 99%. To conclude, it depends on the expertise of the company and if a relevant training dataset is available but in most cases supervised machine learning is recommended.

Ort, förlag, år, upplaga, sidor
2019. , s. 48
Nyckelord [en]
manual bot classification, social bot, metadata, machine learning, supervised learning, unsupervised learning, random forest, k-means
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:his:diva-16994OAI: oai:DiVA.org:his-16994DiVA, id: diva2:1321724
Ämne / kurs
Informationsteknologi
Utbildningsprogram
Datavetenskap - inriktning systemutveckling
Handledare
Examinatorer
Tillgänglig från: 2019-06-10 Skapad: 2019-06-09 Senast uppdaterad: 2019-06-10Bibliografiskt granskad

Open Access i DiVA

fulltext(1067 kB)127 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1067 kBChecksumma SHA-512
4126bed7df8ce6bdac6543989043d0c9c207c7106f2062f2a719688b7193afa6ce0c1d330e4649f426cd88a61cb439a3a40187a95755a37e6949559f3c19c56b
Typ fulltextMimetyp application/pdf

Sök vidare i DiVA

Av författaren/redaktören
Örnbratt, FilipIsaksson, JonathanWilling, Mario
Av organisationen
Institutionen för informationsteknologi
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 127 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 647 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf