Korpusy

Není-li uvedeno jinak, platí pro níže uvedené korpusy následující informace a instrukce:

 • korpusy byly zkompilovány pro korpusový manažer Manatee/Bonito (viz manuál) a uveřejněny pod licencní GPL
 • korpusy lze společně s korpusovým manažerem Manatee/Bonito stáhnout do lokálního počítače – viz níže sekci DOWNLOAD
 • použijete-li následující korpusy pro svou práci, citujte prosím dle bibliografických odkazů uvedených u dané databáze
  • instrukce: zazipovanou složku rozbalte v lokálním počítači, otevřete kořenový adresář a dvojklikněte na ikonu aplikace Bonito; databáze se v dané aplikaci otevře.Poté již lze s daným korpusem standardně pracovat.

SPECIALIZOVANÉ/AUTORSKÉ KORPUSY

 • korpus esejů Otokara Březiny (© Pořízka, Petr)
  • charakteristika projektu – viz Pořízka, P. – Schäfer, F.: Korpus esejů Otokara Březiny (fragment korpusu české esejistiky přelomu 19.–20. století). In: Holman Petr (ed.): Otokar Březina 2008. Vsetín, nakl. Dalibor Malina 2010, s. 95–105. ISBN 78-80-903890-4-5
  • jedná se o lingvisticky anotovaný korpus (lemmatizace + morfologické značky) knihy esejů Hudba pramenů; anotace byla provedena ve třech variantách
   • brezina-hp-pos2only (základní lemma + slovědruhové tagy, tj. první dvě pozice pozičního morfologického tagsetu)
   • brezina-hp-rawlemmas (základní lemma + 15poziční morfologická značka)
   • brezina-hp-annotfull (rozšířené lemma + 15poziční morfologická značka)
  • jak citovat korpus: Pořízka, Petr: Korpus Hudby pramenů Otokara Březiny. Katedra bohemistiky FF UP, Olomouc 2018. Dostupný z WWW: http://corpus.upol.cz/korpusy.
 • korpus esejů Jaroslava Durycha (© Pořízka, Petr)
  • anotovaný korpus (lemmatizace + morfologické značky: základní lemma + 15poziční morfologická značka)
  • jak citovat korpus: Pořízka, Petr: Korpus esejů Jaroslava Durycha. Katedra bohemistiky FF UP, Olomouc 2018. Dostupný z WWW: http://corpus.upol.cz/korpusy.

WORK IN PROGRESS

 • korpus esejů Ladislava Klímy
  • anotovaný korpus (textově-typografické značky)
  • charakteristika projektu – viz Pořízka, P. – Schäfer, F.: Svět jako vědomí a nic Ladislava Klímy v olomouckém korpusu české esejistiky přelomu 19. a 20. století. In: Gilk E. - Hrabal, J. (eds.): Věčnost není děravá kapsa, aby se z ní něco ztratilo. Soubor studií věnovaných Ladislavu Klímovi. Příloha e-1 revue Aluze, Olomouc 2010, s. 60–67. ISSN: 1803-3784 [URL]
 • korpus českých biblických překladů
  • charakteristika projektu – viz Pořízka, P. – Schäfer, F.: Korpus der tschechischen Bibelübersetzungen des späten 18. und frühen 19. Jahrhunderts. In: Theolinguistica 7, 2013, 95–101. ISBN 978-3-8461-1009-6 [URL]
 • Olomoucký korpus mluvené češtiny
  • charakteristika projektu:
   • [2010] Pořízka, P.: Transkripce a sběr dat v korpusech mluvené češtiny. Disertační práce (rkp.). Olomouc 2009.
   • [2009] Pořízka, P.: Olomouc Corpus of Spoken Czech: characterization and main features of the project. In: Linguistik online 38, 2/2009. ISSN 1615-3014 [URL]
   • [2008] Pořízka, P.: Olomoucký mluvený korpus – stav, metodologie, charakteristika. In: Štícha – Fried: Grammar and Corpora / Gramatika a korpus 2007. Praha, Academia 2008, s. 191–198. ISBN 978-80-200-1634-8
   • [2008] Pořízka, P.: Anotace orálních korpusů. Olomoucký mluvený korpus jako model. In: Kopřivová – Waclawičová (eds.): Čeština v mluveném korpusu; řada Studie z korpusové lingvistiky ÚČNK, Praha, NLN 2008, s. 177–189. ISBN 978-80-7106-982-9

 

DOWNLOAD