W dzisiejszych czasach rozpoznawanie jednostek nazwanych (ang. named
entity recognition, NER) i ekstrakcja informacji (ang. information
extraction, IE) z dokumentów różnego typu stały się podstawą do
wspomagania analizy i wykorzystania informacji zawartej w tekście.
Podczas seminarium, na podstawie newsów, poruszony zostanie problem
rozpoznawania i tłumaczenia jednostek nazwanych, a także ich
lematyzacja. Następnie, na podstawie dokumentów dwuwymiarowych (skany,
obrazki), omówiony zostanie temat ekstrakcji informacji w kontekście
dokumentów biznesowych.