Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model – Shahrukh Azhar AHSAN
Shahrukh Azhar AHSAN
Diplomová práce
Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model
Abstract:
The objective of this research is to determine the effectiveness of fine-tuned open-source LLMs in the domain of cybersecurity. Specifically, the study evaluates how effective fine-tuning is for LLMs to learn and provide accurate information about recently reported software vulnerabilities. The LLMs used in this study were Falcon-7B and Llama-2-7b-chat-hf. A custom dataset of 19,135 question-answer …víceAbstract:
The objective of this research is to determine the effectiveness of fine-tuned open-source LLMs in the domain of cybersecurity. Specifically, the study evaluates how effective fine-tuning is for LLMs to learn and provide accurate information about recently reported software vulnerabilities. The LLMs used in this study were Falcon-7B and Llama-2-7b-chat-hf. A custom dataset of 19,135 question-answer …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 20. 8. 2024
Obhajoba závěrečné práce
- Vedoucí: prof. Dr. Michael Heigl
Citační záznam
Citace dle ISO 690:
AHSAN, Shahrukh Azhar. \textit{Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model}. Online. Diplomová práce. České Budějovice: Jihočeská univerzita v Českých Budějovicích, Přírodovědecká fakulta. 2024. Dostupné z: https://theses.cz/id/k1oezu/.
Jak správně citovat práci
AHSAN, Shahrukh Azhar. Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model. České Budějovice, 2024. diplomová práce (Mgr.). JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH. Přírodovědecká fakulta
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH, Přírodovědecká fakultaJIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH
Přírodovědecká fakultaMagisterský studijní program / obor:
Artificial Intelligence and Data Science / Artificial Intelligence and Data Science
Práce na příbuzné téma
-
Practical use of natural language processing in education technology
Dominik Hartinger -
Application of Natural language processing to enhance qualitative research used for marketing
Poj Nuangniyom Netsiri -
Scalability of Semantic Analysis in Natural Language Processing
Radim Řehůřek -
Exploring Semantic Homogeneity in Unlabeled Data Clustering Using Large Language Models
Bashar FARES -
Large Language Models as a tool for generating high-level features for text documents
Vojtěch Balek -
Large Language Models (LLMs): Examining the quality of generated text with task specific data
Michal Caninec -
Think Twice Before You Answer: Mitigating Biases of Question Answering Models
Lukáš Mikula -
Risk Assessment Model for Open Source Software Projects in GitHub
Samuel Macko
Název
Vložil
Vloženo
Práva