2014
2015
2016
2017
2018
2019
2020
2022
2023
2024

Třinácté setkání Pražského informatického semináře

Jan Hajič

Strojový překlad přirozených jazyků

Strojový překlad přirozených jazyků je problém stejně starý jako počítačová lingvistika samotná, a v jejím rámci je to problém, který byl mnohokrát podceněn jak z hlediska metodologického, tak z hlediska doby potřebné k jeho vyřešení – a ani dnes vyřešen není.

23. dubna 2015

16:00

Posluchárna E-107, FEL ČVUT
Karlovo nám. 13, Praha 2
Zobrazit na mapě

Anotace přednášky

Strojový překlad přirozených jazyků je problém stejně starý jako počítačová lingvistika samotná, a v jejím rámci je to problém, který byl mnohokrát podceněn jak z hlediska metodologického, tak z hlediska doby potřebné k jeho vyřešení – a ani dnes vyřešen není. Pohled na překlad prošel vývojovou spirálou od primitivních pokusů o jednoduché statistické řešení přes nesmírně komplikované algoritmy popisující všechny detaily a výjimky v přirozeném jazyce až k dnešním přístupům, které kombinují statistický a lingvistický přístup.

V přednášce bude představen matematický základ moderních překladových systémů, který má základ v teorii informace, a poté budou ukázány principy frázových překladových systémů a rovněž nové přístupy využívající tzv. hluboké analýzy vstupního textu.

Přednášející

Prof. RNDr. Jan Hajič, Dr.

Prof. RNDr. Jan Hajič, Dr. je profesor počítačové lingvistiky v Ústavu formální a aplikované lingvistiky na MFF UK v Praze a v současné době koordinuje výzkumnou infrastrukturu pro jazyková data LINDAT/CLARIN. Věnuje se rovněž přípravě jazykových dat jak pro účely jazykové analýzy, tak i pro účely překladu (anotované korpusy, treebanky). Publikoval přes 170 publikací, řadu z nich se zahraničními spoluautory. V devadesátých letech se podílel v IBM Research na vzniku prvních moderních statistických systémů strojového překladu. V letech 1999-2000 vyučoval na Computer Science Department na John Hopkins University v Baltimore. Byl a je spoluřešitelem několika výzkumných projektů EU v této oblasti (z poslední doby zejména Euromatrix, META-NET, Companions, Khresmoi, Faust, QTLeap, HimL a QT21).

O PRAŽSKÉM INFORMATICKÉM SEMINÁŘI

Seminář se obvykle schází jednou za měsíc ve čtvrtek v 16:15 a to buď v budově FEL ČVUT nebo v budově MFF UK.

Jeho program je tvořen hodinovou přednáškou, po níž následuje časově neomezená diskuse. Základem přednášky je něco (v mezinárodním měřítku) mimořádného nebo aspoň pozoruhodného, na co přednášející přišel a co vysvětlí způsobem srozumitelným a zajímavým i pro širší informatickou obec. Přednášky jsou standardně v angličtině.

Seminář připravuje organizační výbor ve složení Roman Barták (MFF UK), Jaroslav Hlinka (ÚI AV ČR), Michal Chytil, Pavel Kordík (FIT ČVUT), Michal Koucký (MFF UK), Jan Kybic (FEL ČVUT), Michal Pěchouček (FEL ČVUT), Jiří Sgall (MFF UK), Vojtěch Svátek (FIS VŠE), Michal Šorel (ÚTIA AV ČR), Tomáš Werner (FEL ČVUT), Filip Železný (FEL ČVUT)

Idea Pražského informatického semináře vznikla z rozhovorů představitelů několika vědeckých institucí na téma, jak odstranit zbytečnou fragmentaci informatické komunity v ČR.

Podporovatelé

Kontakt

Pražský informatický seminář je z důvodů prevence šíření nákazy novým koronavirem do odvolání pozastaven.