• 1.Jak rámcově funguje hledání podobných dokumentů?
  Obsah souborů v datovém úložišti theses.cz, u kterých je k dispozici čistě textová verze, je průběžně strojově analyzován. Každou závěrečnou práci, kterou si v systému vyhledáte, lze porovnat a zobrazit si soubory, které mají podobný obsah:
  • kliknutím na název práce si zobrazíte základní informace o práci,
  • dole na stránce klikněte na řádek se souborem s plným textem práce (kliknutí pravým tlačítek myši vyvolá panel podrobností vpravo, kliknutí levým tlačítkem vyvolá kontextové menu),
  • použitím operace „Vyhledat podobné soubory“ vyhledáte podobné soubory.

  1 Operace „Vyhledat podobné soubory“.

  U nalezených podobných souborů systém vypíše míru shody v procentech a zobrazí červeně v textu jednotlivé podobnosti. K prověření můžete vybrat jeden soubor či více souborů a porovnat si podobnosti jen s vybranými soubory. O globálním porovnávání souborů (tzn. všech vzájemně mezi sebou) se více dozvíte v nápovědě Globální vyhledávání plagiátů.

  Soubory se vyhledávají v celém systému, tedy bez ohledu na školu, kam práce patří.

  Tip

  Vyzkoušejte novou verzi algoritmu pro vyhledávání podobností, blíže v otázce „Jak funguje nový algoritmus?“

 • 2.Co znamená „Dokument asi není správně porovnán“?
  Porovnává se podle textových verzí souborů. V textové verzi nebylo nalezeno dostatečné množství slov, které by se pro porovnání mohlo použít. Nahlédněte do textové verze (s příponou .txt) souboru, zda se vytvořila správně. Pokud usoudíte, že se textová verze nevytvořila správně, můžete zkusit požádat vkladatele souboru, aby si sám ověřil (např. ve Wordu), zda lze soubor exportovat do textu; příp. aby zajistil nové vložení opravené verze. Problematické jsou HTML soubory, které obsahují hodně slov, které nejsou součástí textu (formátovací příkazy apod.). Také můžete poslat adresu chybného souboru na adresu správců theses@fi.muni.cz.

 • 3.Co vyjadřuje údaj celková podobnost?
  Tento údaj uvádí celkové procento podobnosti se všemi nalezenými podobnými dokumenty.

 • 4.K čemu slouží funkce „Podobnosti s vybranými“?

  U původního algoritmu si uživatel musí zaškrtnout dokumenty, pro které chce spočítat procento podobnosti zkoumaného dokumentu s vybranými podobnými dokumenty. Např. pokud se najde podobnost se zákonem, který je správně citován, uživatel může vyjmout tento dokument a přepočítat podobnost pouze s ostatními nalezenými podobnými dokumenty, ke kterým si zobrazí červeně zvýrazněné podobné pasáže.

  U nového algoritmu jsou podobnosti s dokumenty zobrazeny rovnou.

  Tip

  Vyzkoušejte novou verzi algoritmu pro vyhledávání podobností, blíže v otázce „Jak funguje nový algoritmus?“

 • 5.Systém našel k mé práci podobnosti, co to znamená?
  Důležité upozornění!

  Podobnost, kterou systém nalezl mezi vaší prací a prací/pracemi v databázi, nemusí vždy nutně znamenat, že se jedná o plagiát. Každou práci (podobnost) je nutné posoudit individuálně, zkontrolovat správnost citací apod. Neexistuje univerzální hodnota %, od které lze práci považovat za plagiát.

  1 Procento celkové podobnosti s dokumenty v databázi a zdroji z internetu.

  2 Zdroje, se kterými je práce podobná. Je vhodné, aby student zkontroloval, zda například zdroje řádně cituje. Ty, které jsou v pořádku, může student za pomoci křížku z výpočtu odstranit.

  3 U každého zdrojového dokumentu je menu pod ikonou tří teček, kde lze o dokumentu zjistit více informací.

  4 Šipky umožňují rychlý přesun od jedné podobnosti k druhé.

 • 6.Jak funguje nový algoritmus?

  Nový algoritmus byl nasazen v roce 2021 a soustřeďuje se na parafrázované, tedy přeformulované texty. Na druhou stranu nemusí vyhodnotit jako podobné velmi krátké pasáže sestávající například z názvu zákona, definice, sousloví apod. které obvykle nejde ani jinak vyjádřit. Další jeho vlastností je, že "přeskakuje" ty z nalezených zdrojů, které z hlediska podobností nepředstavují oproti již zobrazeným žádnou přidanou hodnotu a v seznamu relevantních zdrojových dokumentů by jednou vyznačené podobnosti již jen duplikovaly. Pro lepší přehlednost začíná algoritmus přeskakovat dokumenty pokud počet zdrojů přesáhne desítku. I tyto přeskočené zdroje si však lze zobrazit a podrobit kontrole. Procento celkové podobnosti tedy kvůli těmto změnám bude ve srovnání s předchozím algoritmem rozdílné, může být nižší, anebo naopak vyšší. Rozhodně však nedoporučujeme, aby se uživatelé řídili procentem podobnosti. Je to jen číslo a i nález 1 % může znamenat závažné porušení autorského zákona. Opačně ani vysoké procento podobnosti nemusí být známkou plagiátorství.

  Spočítání podobných dokumentů je rychlé, kontrola podobností je možná ihned po vytvoření textové verze souboru (zpravidla do několika desítek minut od zavedení nového dokumentu). U nalezených podobných dokumentů IS MU vypíše míru shody v procentech. K dispozici je i celková spočítaná podobnost dokumentu s ostatními:

  1 Procento celkové podobnosti s dokumenty v databázi a zdroji z internetu.

  2 Seznam zdrojových dokumentů, se kterými je dokument podobný. U každého je zobrazeno procento podobnosti.

  3 U každého zdrojového dokumentu je menu pod ikonou tří teček, kde lze o dokumentu zjistit více informací.

  4 Za pomoci křížku lze odstranit z výpočtu zdrojový dokument, který není pro porovnání podobností relevantní (například z něj měl student čerpat a má jej řádně citovaný).

  5 Po kliknutí na vybranou zvýrazněnou podobnou pasáž se zobrazí dokumenty, se kterými je text podobný.

  6 Číslo v oválu označuje počet dokumentů, se kterými je následující pasáž podobná.

  7 Po kliknutí se přehledně zobrazí počty zobrazených, přeskočených i vyřazených dokumentů včetně vysvětlení.

  8 Ovály s čísly udržují přehled o zdrojových dokumentech. Přeskočené dokumenty lze zobrazit, vyřazené dokumenty obnovit.


Nenašli jste odpověď? Pošlete nám svůj dotaz na theses(zavináč/atsign)fi(tečka/dot)muni(tečka/dot)cz.