Högskolan i Skövde

his.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • apa-cv
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Evaluating large language models’ capability to generate algorithmic code using prompt engineering
Högskolan i Skövde, Institutionen för informationsteknologi.
Högskolan i Skövde, Institutionen för informationsteknologi.
Högskolan i Skövde, Institutionen för informationsteknologi.
2024 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)
Abstract [en]

The study evaluated the performance of large language models (LLMs) such as Gemini, ChatGPT- 4, and GitHub Copilot in generating C++ algorithms for specific tasks using different prompting techniques. The central aim was to assess the effectiveness of these models in creating code solutions that are both functionally correct and complete, using a combination of automated unit tests and human evaluation. Across two main tasks (Social Network and Huffman Encoding), the models showed different levels of success in generating functionally correct code. Github Copilot and ChatGPT-4 generally produced more syntactically accurate and functionally appropriate code than Gemini, There was a notable variation in completeness, whether the code met all the tasks’ specified requirements. Some models managed to include all necessary functionalities more consistently than others. Gemini, for instance, excelled in generating complete solutions for the Social Network task but had issues with the Huffman Encoding task, where its output often did not integrate the provided code effectively or correctly. 

Ort, förlag, år, upplaga, sidor
2024. , s. 3, 42, xv
Nyckelord [en]
LLM, large language model, ChatGPT, Gemini, Github Copilot, prompt engineering, algorithm
Nationell ämneskategori
Systemvetenskap, informationssystem och informatik med samhällsvetenskaplig inriktning
Identifikatorer
URN: urn:nbn:se:his:diva-24285OAI: oai:DiVA.org:his-24285DiVA, id: diva2:1883138
Ämne / kurs
Informationsteknologi
Utbildningsprogram
Datavetenskap - inriktning systemutveckling, 180 hp
Handledare
Examinatorer
Tillgänglig från: 2024-07-09 Skapad: 2024-07-09 Senast uppdaterad: 2024-07-09Bibliografiskt granskad

Open Access i DiVA

fulltext(1324 kB)242 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1324 kBChecksumma SHA-512
ca05f209d8b06cf402baf01f41bda8bb96b4bab8275dd0db6f413c7bcac04196d06eaf0712dffcc06145ffd0f2ca07642b7f0d50a9c14d0ee13cc7aa1825be5b
Typ fulltextMimetyp application/pdf

Av organisationen
Institutionen för informationsteknologi
Systemvetenskap, informationssystem och informatik med samhällsvetenskaplig inriktning

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 242 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 615 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • apa-cv
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf