A hybrid approach to parallel text alignment – Bc. Adam Obrusník
Bc. Adam Obrusník
Bachelor's thesis
A hybrid approach to parallel text alignment
A hybrid approach to parallel text alignment
Abstract:
Práce se zabývá automatickým zarovnáváním (alignmentem) dvojjazyčných paralelních textů. V teoretické části práce jsou popsány a porovnány současné přístupy k této problematice, které jsou rozděleny do tří kategorií: statistické, heuristické a založené na klíčových slovech. V praktické části je navržen a implementován hybridní algorithmus, který kombinuje prvky statistických metod a metod založených …moreAbstract:
This work deals with automatic parallel text alignment. In the theoretical part, the existing parallel text alignment approaches are described and compared. The approaches are classified into three categories, statistical, heuristic and anchor word based. In the practical part, a hybrid algorithm combining elements of the statistical approach and anchor word based approach is designed and implemented …more
Language used: English
Date on which the thesis was submitted / produced: 20. 1. 2013
Identifier:
https://is.muni.cz/th/i47go/
Thesis defence
- Date of defence: 1. 2. 2013
- Supervisor: M.A. James Edward Thomas
- Reader: Ing. Mgr. Jiří Rambousek, Ph.D.
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Filozofická fakultaMasaryk University
Faculty of ArtsBachelor programme / field:
Philology / English Language and Literature
Theses on a related topic
-
Elektronický kurz počítačové lingvistiky
Michala Vacíková -
Parallel Corpus from Wikipedia
Adéla Štromajerová -
The discourse marker anyway in the parallel translation corpus InterCorp
Lukáš HRNČÍŘ -
Boundary-crossing constraint: Evidence from a parallel corpus of Spanish and English
Lucie KOVÁŘOVÁ -
Learner Translation Corpus: CELTraC (Czech-English Learner Translation Corpus)
Kristýna Štěpánková -
Dummy subjects in English, Norwegian and German. A parallel corpus study.
Bohumila Chocholoušová -
Parallel Corpus in Sketch Engine: Creation and Data Mining
Magdaléna VYVIJALOVÁ -
Traducción de las formas del gerundio del español al checo: Análisis a través del corpus paralelo InterCorp
Ilona Mužátková