Bc. Tomáš ŽELEZNÝ

Diplomová práce

Image Captioning using Deep Learning

Image captioning using deep learning
Abstract:
In this work, I discuss an automatic image captioning technique based on an existing method Oscar. Using a Faster-R-CNN detection network, I pre-process the images so that they can be further used by Oscar. By combining these two methods, I create a pipeline that allows me to generate a caption for any image. I evaluate its performance using metrics BLEU-4: 0.312, METEOR: 0.272, CIDEr: 1.02, and SPICE …více
Abstract:
V této práci se zabývám technikou automatického popisu obrázků, založenou na existující metodě Oscar. Pomocí detekční sítě Faster-R-CNN vhodně předzpracovávám obrázky tak, aby mohly být dále použity metodou Oscar. Spojením těchto dvou metod vytvářím systém, který umožňuje vygenerování popisku pro libovolný obrázek. Tento systém je poté vyhodnocen na metrikách BLEU-4: 0.312, METEOR: 0.272, CIDEr: 1 …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 23. 5. 2022
Zveřejnit od: 31. 12. 2999

Obhajoba závěrečné práce

  • Vedoucí: Ing. Marek Hrúz, Ph.D.

Citační záznam

Jak správně citovat práci

ŽELEZNÝ, Tomáš. Image Captioning using Deep Learning. Plzeň, 2022. diplomová práce (Ing.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd

Plný text práce

Právo: Autor si nepřeje zpřístupnění práce veřejnosti

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • Soubory jsou nedostupné.
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných věd
Vázaný výtisk práce naleznete v Univerzitní knihovně ZČU, více na http://www.knihovna.zcu.cz/kvalifikacni-prace/

ZÁPADOČESKÁ UNIVERZITA V PLZNI

Fakulta aplikovaných věd

Magisterský studijní program / obor:
Aplikované vědy a informatika / Kybernetika a řídicí technika