Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model

AHSAN, Shahrukh Azhar

EN SKPřihlásit se Přihlásit se (EduID)

Theses k1oezu

Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model – Shahrukh Azhar AHSAN

Zpět na vyhledávání

Shahrukh Azhar AHSAN

Diplomová práce

Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model

Abstract:

The objective of this research is to determine the effectiveness of fine-tuned open-source LLMs in the domain of cybersecurity. Specifically, the study evaluates how effective fine-tuning is for LLMs to learn and provide accurate information about recently reported software vulnerabilities. The LLMs used in this study were Falcon-7B and Llama-2-7b-chat-hf. A custom dataset of 19,135 question-answer …více

Abstract:

The objective of this research is to determine the effectiveness of fine-tuned open-source LLMs in the domain of cybersecurity. Specifically, the study evaluates how effective fine-tuning is for LLMs to learn and provide accurate information about recently reported software vulnerabilities. The LLMs used in this study were Falcon-7B and Llama-2-7b-chat-hf. A custom dataset of 19,135 question-answer …více

Keywords

machine learning large language models cybersecurity open-source LLMs LoRA QLoRA natural language processing transformers fine-tuning

Jazyk práce: angličtina

Datum vytvoření / odevzdání či podání práce: 20. 8. 2024

Obhajoba závěrečné práce

Vedoucí: prof. Dr. Michael Heigl

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

AHSAN, Shahrukh Azhar. \textit{Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model}. Online. Diplomová práce. České Budějovice: Jihočeská univerzita v Českých Budějovicích, Přírodovědecká fakulta. 2024. Dostupné z: https://theses.cz/id/k1oezu/.

@MastersThesis{AHSAN2024thesis,
AUTHOR = "AHSAN, Shahrukh Azhar",
TITLE = "Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model [online]",
YEAR = "2024 [cit. 2024-11-12]",
TYPE = "Diplomová práce",
SCHOOL = "Jihočeská univerzita v Českých Budějovicích, Přírodovědecká fakultaČeské Budějovice",
NOTE = "SUPERVISOR: prof. Dr. Michael Heigl",
URL = "https://theses.cz/id/k1oezu/",
}

@MastersThesis{AHSAN2024thesis,
AUTHOR = {AHSAN, Shahrukh Azhar},
TITLE = {Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model},
YEAR = {2024},
TYPE = {Diplomová práce},
INSTITUTION = {Jihočeská univerzita v Českých Budějovicích, Přírodovědecká fakulta},
LOCATION = {České Budějovice},
SUPERVISOR = {prof. Dr. Michael Heigl},
URL = {https://theses.cz/id/k1oezu/},
URL_DATE = {2024-11-12},
}

{{Citace kvalifikační práce
 | příjmení = AHSAN
 | jméno = Shahrukh Azhar
 | instituce = Jihočeská univerzita v Českých Budějovicích, Přírodovědecká fakulta
 | titul = Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model
 | url = https://theses.cz/id/k1oezu/
 | typ práce = Diplomová práce
 | vedoucí = prof. Dr. Michael Heigl
 | rok = 2024
 | počet stran =
 | strany =
 | citace = 2024-11-12
 | poznámka =
 | jazyk = 
}}

Jak správně citovat práci

AHSAN, Shahrukh Azhar. Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model. České Budějovice, 2024. diplomová práce (Mgr.). JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH. Přírodovědecká fakulta

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH, Přírodovědecká fakulta

Odkaz na soubor do lokálního úložiště instituce

JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH

Přírodovědecká fakulta

Magisterský studijní program / obor:
Artificial Intelligence and Data Science / Artificial Intelligence and Data Science

Práce na příbuzné téma

Practical use of natural language processing in education technology
Dominik Hartinger
Application of Natural language processing to enhance qualitative research used for marketing
Poj Nuangniyom Netsiri
Scalability of Semantic Analysis in Natural Language Processing
Radim Řehůřek
Exploring Semantic Homogeneity in Unlabeled Data Clustering Using Large Language Models
Bashar FARES
Large Language Models as a tool for generating high-level features for text documents
Vojtěch Balek
Large Language Models (LLMs): Examining the quality of generated text with task specific data
Michal Caninec
Think Twice Before You Answer: Mitigating Biases of Question Answering Models
Lukáš Mikula
Risk Assessment Model for Open Source Software Projects in GitHub
Samuel Macko

Všechny práce

Název

Vložil

Vloženo

Práva

Theses k1oezu k1oezu/2

20. 8. 2024

Složky

Soubory

thesis Developing_a_Cybersecurity_Domain_Chatbot_based_on_an_Ope.pdf

Bulánová, L.

21. 8. 2024

Co je jinak přidání souboru

Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
Co je jinak další operace se soubory

Podrobnosti lze zjistit označením příslušného řádku.
Co je jinak pohled pro experty

Pro častou práci je možné zvolit režim Více možností.
Co je nové vyhledávání souborů

Vyhledávaný výraz můžete zadat přímo do adresního řádku.
Co je nové rychlý přístup k souborům

Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.
Co se chystá

Připravujeme další vylepšení pro mobilní zařízení.

Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model – Shahrukh Azhar AHSAN

Shahrukh Azhar AHSAN

Diplomová práce

Developing a Cybersecurity Domain Chatbot based on an Open Source Large Language Model

Abstract:

Abstract:

Keywords

Obhajoba závěrečné práce

Citační záznam

Citace dle ISO 690:

Jak správně citovat práci

Plný text práce

Obsah online archivu závěrečné práce

Jak jinak získat přístup k textu

JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH

Práce na příbuzné téma

Složky

Soubory

Co je jinak přidání souboru

Co je jinak další operace se soubory

Co je jinak pohled pro experty

Co je nové vyhledávání souborů

Co je nové rychlý přístup k souborům

Co se chystá