Korpusowa infrastruktura badawcza dla polszczyzny

OPIS

CELE GRUPY
Rozwój i poszerzenie formuły korpusu narodowego, opracowanie standardów reprezentacji danych i narzędzi korpusowych

ZADANIA GRUPY
1. Rozszerzenie bazy materiałowej Narodowego Korpusu Języka Polskiego (o podkorpusy diachroniczne, podkorpusy równoległe, specjalistyczne, w tym gwarowy, dane mówione, podkorpus synchroniczny tworzony na bazie bibliotek cyfrowych i Internetu)
2. Opracowanie korpusowych standardów znakowania dla języka polskiego (metadane i znaczniki morfosyntaktyczne dla wszystkich podkorpusów, znaczniki składniowe, semantyczne i dyskursywne dla danych współczesnych)
3. Opracowanie metod reprezentacji danych multimedialnych (zrównoleglanie tekstów ze źródłami, wyszukiwanie w danych mówionych, wideo, skanach)
4. Opracowanie interfejsu użytkownika korpusu uwzględniającego proste formułowanie zapytań, atrakcyjną i czytelną wizualizację wyników oraz metody wizualizacji zaawansowanych struktur lingwistycznych
5. Rozwój narzędzi do samodzielnego tworzenia korpusów, eksploracji i analizy danych korpusowych
6. Monitoring źródeł internetowych na potrzeby korpusowe i leksykograficzne
7. Rozwijanie współpracy krajowej w ramach konsorcjów DARIAH-PL i CLARIN-PL oraz międzynarodowej w ramach europejskich infrastruktur badawczych DARIAH ERIC i CLARIN ERIC; weryfikacja rozwiązań dla korpusów wypracowywanych w ramach projektów tematycznych dot. standardów dla humanistyki cyfrowej (np. Parthenos).

UCZESTNICY

  • Instytut Podstaw Informatyki PAN
  • Instytut Badań Literackich PAN
  • Instytut Języka Polskiego PAN
  • Uniwersytet Łódzki
  • Uniwersytet Mikołaja Kopernika w Toruniu
  • Uniwersytet Warszawski
  • Uniwersytet Wrocławski

ZESPÓŁ BADAWCZY

dr Maciej Ogrodniczuk (IPI PAN)

dr hab. Adam Przepiórkowski (IPI PAN)

dr Marcin Woliński (IPI PAN)

dr Patrycja Potoniec (IBL PAN)

mgr Krzysztof Opaliński (IBL PAN)

dr Monika Biesaga (IJP PAN)

dr Renata Bronikowska (IJP PAN)

dr hab. Rafał L. Górski (IJP PAN)

prof. dr hab. Włodzimierz Gruszczyński (IJP PAN)

dr Piotr Pęzik (UŁ, Anglistyka)

dr hab. Adam Dobaczewski (UMK)

dr hab. Małgorzata Gębka-Wolak (UMK)

dr hab. Andrzej Moroz (UMK)

dr hab. Magdalena Derwojedowa (UW)

prof. dr hab. Halina Karaś (UW)

dr hab. Marek Łaziński (UW)

prof. dr hab. Adam Pawłowski (UWr)

KONTAKT

dr Maciej Ogrodniczuk

ul. Jana Kazimierza 5

01-248 Warszawa

tel. 533 675 675

e-mail: maciej.ogrodniczuk@ipipan.waw.pl