Korpusy

Není-li uvedeno jinak, platí pro níže uvedené korpusy následující informace a instrukce:

  • korpusy byly zkompilovány pro korpusový manažer Manatee/Bonito (viz manuál) a uveřejněny pod licencní GPL
  • korpusy lze společně s korpusovým manažerem Manatee/Bonito stáhnout do lokálního počítače – viz níže sekci DOWNLOAD
  • použijete-li následující korpusy pro svou práci, citujte prosím dle bibliografických odkazů uvedených u dané databáze
    • instrukce: zazipovanou složku rozbalte v lokálním počítači, otevřete kořenový adresář a dvojklikněte na ikonu aplikace Bonito.; objeví se dialogové okno Login –> překlikněte na Spustit lokálně a potvrďte; poté již lze s daným korpusem standardně pracovat

SPECIALIZOVANÉ/AUTORSKÉ KORPUSY

  • korpus esejů Otokara Březiny (termín zveřejnění: březen 2015; 2015-03-04)
    • charakteristika projektu – viz Pořízka, P. – Schäfer, F.: Korpus esejů Otokara Březiny (fragment korpusu české esejistiky přelomu 19.–20. století). In: Holman Petr (ed.): Otokar Březina 2008. Vsetín, nakl. Dalibor Malina 2010, s. 95–105. ISBN 78-80-903890-4-5
    • jedná se o lingvisticky anotovaný korpus (lemmatizace + morfologické značky) knihy esejů Hudba pramenů; anotace byla provedena ve třech variantách
      • brezina-hp-pos2only (základní lemma + slovědruhové tagy, tj. první dvě pozice pozičního morfologického tagsetu)
      • brezina-hp-rawlemmas (základní lemma + 15poziční morfologická značka)
      • brezina-hp-annotfull (rozšířené lemma + 15poziční morfologická značka)
    • jak citovat korpus: Pořízka, Petr: Korpus esejů Otokara Březiny. Katedra bohemistiky FF UP, Olomouc 2015. Dostupný z WWW: http://corpus.upol.cz/korpusy.
  • korpus esejů Jaroslava Durycha (termín zveřejnění: leden 2017; 2017-01-17)
    • anotovaný korpus (lemmatizace + morfologické značky: základní lemma + 15poziční morfologická značka)
    • jak citovat korpus: Pořízka, Petr: Korpus esejů Jaroslava Durycha. Katedra bohemistiky FF UP, Olomouc 2017. Dostupný z WWW: http://corpus.upol.cz/korpusy.

WORK IN PROGRESS

  • korpus esejů Ladislava Klímy (termín zveřejnění: jaro 2017)
    • anotovaný korpus (textově-typografické značky)
    • charakteristika projektu – viz Pořízka, P. – Schäfer, F.: Svět jako vědomí a nic Ladislava Klímy v olomouckém korpusu české esejistiky přelomu 19. a 20. století. In: Gilk E. - Hrabal, J. (eds.): Věčnost není děravá kapsa, aby se z ní něco ztratilo. Soubor studií věnovaných Ladislavu Klímovi. Příloha e-1 revue Aluze, Olomouc 2010, s. 60–67. ISSN: 1803-3784 [URL]
  • korpus českých biblických překladů (termín zveřejnění: konec roku 2017)
    • charakteristika projektu – viz Pořízka, P. – Schäfer, F.: Korpus der tschechischen Bibelübersetzungen des späten 18. und frühen 19. Jahrhunderts. In: Theolinguistica 7, 2013, 95–101. ISBN 978-3-8461-1009-6 [URL]
  • Olomoucký korpus mluvené češtiny (termín zveřejnění: konec roku 2017)
    • charakteristika projektu:
      • [2010] Pořízka, P.: Transkripce a sběr dat v korpusech mluvené češtiny. Disertační práce (rkp.). Olomouc 2009.
      • [2009] Pořízka, P.: Olomouc Corpus of Spoken Czech: characterization and main features of the project. In: Linguistik online 38, 2/2009. ISSN 1615-3014 [URL]
      • [2008] Pořízka, P.: Olomoucký mluvený korpus – stav, metodologie, charakteristika. In: Štícha – Fried: Grammar and Corpora / Gramatika a korpus 2007. Praha, Academia 2008, s. 191–198. ISBN 978-80-200-1634-8
      • [2008] Pořízka, P.: Anotace orálních korpusů. Olomoucký mluvený korpus jako model. In: Kopřivová – Waclawičová (eds.): Čeština v mluveném korpusu; řada Studie z korpusové lingvistiky ÚČNK, Praha, NLN 2008, s. 177–189. ISBN 978-80-7106-982-9

 

DOWNLOAD