Source Code Generation from Descriptions in a Natural Language – Bc. Jan PAŠEK
Bc. Jan PAŠEK
Diplomová práce
Source Code Generation from Descriptions in a Natural Language
Source Code Generation from Descriptions in a Natural Language
Abstract:
This work introduces CodeFormer, a Python source code generator pre-trained on a massive GitHub crawl consisting of 230M Python functions. The released model, built on BART architecture, generates Python functions based on descriptions in English. On a CodeSearchNet dataset, the CodeFormer sets a new state of the art with 46.12 BLEU, representing an improvement of 13.86 BLEU. We also release a new …víceAbstract:
Tato diplomová práce představuje CodeFormer, nový model neuronové sítě, schopný na základě popisu úlohy v anglickém jazyce generovat funkce v programovacím jazyce Python. Tento model, založený na architektuře modelu BART, je předtrénovaný na 230 milionech funkcích získaných z veřejných GitHub repozitářů. Po dotrénování na CodeSearchNet datasetu náš model překonává konkurenční modely a nastavuje tak …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 18. 5. 2022
Zveřejnit od: 31. 12. 2999
Obhajoba závěrečné práce
- Vedoucí: Ing. Miloslav Konopík, Ph.D.
Citační záznam
Jak správně citovat práci
PAŠEK, Jan. Source Code Generation from Descriptions in a Natural Language. Plzeň, 2022. diplomová práce (Ing.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd
Plný text práce
Právo: Autor si nepřeje zpřístupnění práce veřejnosti
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou nedostupné.
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných vědVázaný výtisk práce naleznete v Univerzitní knihovně ZČU, více na http://www.knihovna.zcu.cz/kvalifikacni-prace/
ZÁPADOČESKÁ UNIVERZITA V PLZNI
Fakulta aplikovaných vědMagisterský studijní program / obor:
Inženýrská informatika / Softwarové inženýrství
Práce na příbuzné téma
-
Zpracování přirozeného jazyka: analýza mluveného jazyka studentů oboru informační technologie
Aleksandar Stanković -
Zpracování přirozeného jazyka ve videohrách: Případová studie AI Dungeon
Viktor Porokh -
Zpracování nových gramatických fenoménů v logické analýze přirozeného jazyka
Renáta Pivodová -
Geocoding služba s využitím zpracování přirozeného jazyka
Tomáš Večeřa -
Implementace uživatelského rozhraní webové aplikace pro řešení úloh v oblasti zpracování přirozeného jazyka
Zdeněk Illek -
Neuronové sítě pro zpracování přirozeného jazyka
Jan ČEDÍK -
Možnosti využití umělé inteligence a zpracování přirozeného jazyka ve vzdělávání
Jana ZEMANOVÁ -
Srovnání cloudových ML platforem se zaměřením na zpracování přirozeného jazyka
Dominik Botur