Využití explicitní sémantické analýzy pro detekci podobností ve zdrojových kódech – Bc. Richard Všianský
Bc. Richard Všianský
Master's thesis
Využití explicitní sémantické analýzy pro detekci podobností ve zdrojových kódech
Using explicit semantic analysis to detect source code similarities
Abstract:
Diplomová práce se zabývá využitím explicitní sémantické analýzy v odhalovaní podobností ve zdrojových kódech v kontextu plagiátorství. Pro vybudování sémantického interpretu bylo využito 40 829 článků z Wikipedie a analýza se testovala na 25 speciálně vytvořených souborech za pomocí plagiátorských technik a pěti staženými napříč pěti jazyky: Java, Javascript, PHP, C++ a Python. Další dataset o velikosti …moreAbstract:
This diploma thesis deals with using of explicit semantic analysis for detection similarities in source codes in the context of plagiarism. For building a semantic interpreter 40 829 Wikipedia articles were used and the analysis was tested on 25 specially created documents using plagiarism techniques and 5 downloaded documents. The dataset was consisted of five languages: Java, Javascript, PHP, C+ …more
Language used: Czech
Date on which the thesis was submitted / produced: 17. 5. 2019
Thesis defence
- Supervisor: Mgr. Tomáš Foltýnek, Ph.D.
- Reader: Dita Dlabolová, Ph.D.
Citation record
ISO 690-compliant citation record:
VŠIANSKÝ, Richard. \textit{Využití explicitní sémantické analýzy pro detekci podobností ve zdrojových kódech}. Online. Master's thesis. Brno: Mendelova univerzita v Brně, Faculty of Business and Economics. 2019. Available from: https://theses.cz/id/o6puuc/.
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Mendelova univerzita v Brně, Provozně ekonomická fakultaMendel University in Brno
Faculty of Business and EconomicsMaster programme / field:
System engineering and informatics / Economic informatics
Theses on a related topic
-
Explicitní sémantická analýza
Michal TUŠL -
Using Explicit Semantic Analysis to Link in Multi-Lingual Document Collections
Lukáš Žilka -
String Analysis for Software Verification
Martina Olliaro -
Systém na odhalování plagiátorství v úlohách z Lispu
Robert VAVRUŠA -
Source Code Quality Impact on Pull Requests Acceptance
Ondřej Kuhejda -
AI-driven Software Development Source Code Quality
Petr Kantek -
Comparison of Source Code Reviewer Recommendation Algorithms
Kristína Lalíková -
Migrating to source-code hosting platform: Team's Workflow Improvement
Petr Šlézar