Think Twice Before You Answer: Mitigating Biases of Question Answering Models

Mikula, Lukáš

CS ENPrihlásiť sa Prihlásiť sa (EduID)

Theses s8blbw

Think Twice Before You Answer: Mitigating Biases of Question Answering Models – Mgr. Lukáš Mikula

Zpět na vyhledávání

Mgr. Lukáš Mikula

Master's thesis

Think Twice Before You Answer: Mitigating Biases of Question Answering Models

Anotácia:

Veľké jazykové modely (z angl. Large Language Models) založené na architektúre Transformerov predstavujú najlepšie modely pre vačšinu problémov spracovania prirodzeného jazyka (z angl. Natural Language Modeling). Napriek tomu majú tieto modely tendenciu učiť sa skreslenia a systematické chyby z trénovacích datasetov. Toto učenie im síce môže pomôcť na datasetoch s rovnakou distribúciou, lenže znižuje …viac

Abstract:

Large Language Models based on Transformer architecture hold state-of-the-art in a majority of Natural Language Modeling tasks. Nevertheless, these models tend to learn biases from training dataset, which help them on the training dataset, but hurt their out-of-domain accuracy as a result. This work focuses on obtaining more robust BERT models for the Extractive Question Answering task. We explore …viac

Keywords

BERT SQuAD biases Extractive Question Answering robustness super-sampling fine-tuning Transformers

Jazyk práce: English

Datum vytvoření / odevzdání či podání práce: 17. 5. 2022

Identifikátor: https://is.muni.cz/th/adh58/

Obhajoba závěrečné práce

Obhajoba proběhla 22. 6. 2022
Vedúci: Mgr. Michal Štefánik
Oponent: RNDr. Vít Suchomel, Ph.D.

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

MIKULA, Lukáš. \textit{Think Twice Before You Answer: Mitigating Biases of Question Answering Models}. Online. Diplomová práca. Brno: Masarykova univerzita, Faculty of Informatics. 2022. Dostupné z: https://theses.cz/id/s8blbw/.

{{Citace kvalifikační práce
 | příjmení = Mikula
 | jméno = Lukáš
 | instituce = Masarykova univerzita, Faculty of Informatics
 | titul = Think Twice Before You Answer: Mitigating Biases of Question Answering Models
 | url = https://theses.cz/id/s8blbw/
 | typ práce = Diplomová práca
 | vedoucí = Mgr. Michal Štefánik
 | rok = 2022
 | počet stran =
 | strany =
 | citace = 2024-04-30
 | poznámka =
 | jazyk = 
}}

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Odkaz na adresář do lokálního úložiště instituce

Masaryk University

Faculty of Informatics

Master programme / odbor:
Artificial intelligence and data processing / Big data

Práce na příbuzné téma

Cross-lingual sentiment analysis with BERT
Mohsen Amini Riseh
BERT models in document classification
Ahmad Arsalan Khateeb
Analýza díla Jiřiny Prekopové a Berta Hellingera z transkulturní perspektivy
Lukáš Nosek
Přenos a tvorba elektronických položek v platebním systému České republiky
Berta Smékalová