Bc. Richard Všianský

Master's thesis

Využití explicitní sémantické analýzy pro detekci podobností ve zdrojových kódech

Using explicit semantic analysis to detect source code similarities
Abstract:
Diplomová práce se zabývá využitím explicitní sémantické analýzy v odhalovaní podobností ve zdrojových kódech v kontextu plagiátorství. Pro vybudování sémantického interpretu bylo využito 40 829 článků z Wikipedie a analýza se testovala na 25 speciálně vytvořených souborech za pomocí plagiátorských technik a pěti staženými napříč pěti jazyky: Java, Javascript, PHP, C++ a Python. Další dataset o velikosti …more
Abstract:
This diploma thesis deals with using of explicit semantic analysis for detection similarities in source codes in the context of plagiarism. For building a semantic interpreter 40 829 Wikipedia articles were used and the analysis was tested on 25 specially created documents using plagiarism techniques and 5 downloaded documents. The dataset was consisted of five languages: Java, Javascript, PHP, C+ …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 17. 5. 2019

Thesis defence

  • Supervisor: Mgr. Tomáš Foltýnek, Ph.D.
  • Reader: Dita Dlabolová, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Mendelova univerzita v Brně, Provozně ekonomická fakulta

Mendel University in Brno

Faculty of Business and Economics

Master programme / field:
System engineering and informatics / Economic informatics