Statystyczne tłumaczenie mowy

Wykładowca: dr hab. Krzysztof Marasek
Polsko-Japońska Wyższa Szkoła Technik Komputerowych

Termin: 2 grudnia 2014 godz. 16:15-17:30, sala 134 GG

Tłumaczenie mowy (SLT) jako element komunikacji międzyludzkiej staje się coraz istotniejsze
w zglobalizowanym świecie. Jest to jedno z największych wyzwań dla automatycznego rozpoznawania mowy (ASR) i tłumaczenia maszynowego (MT), a intensywne prace badawcze w tych dziedzinach prowadzone są zarówno w instytutach badawczych jak i laboratoriach największych firm. Wcześniejsze badania nad SLT, ze względu na ograniczenia technologiczne, koncentrowały się głównie na wypowiedziach nagranych
w kontrolowanych warunkach, dziś głównym wyzwaniem jest tłumaczenie z języka mówionego, jaki można znaleźć w codziennym życiu. Rozpatrywane scenariusze obejmują szeroki zastosowań: od przenośnych tłumaczy dla turystów, poprzez tłumaczenie na żywo wykładów, prezentacji, wiadomości do ich prezentacji z napisami w dodatkowym języku. Chcielibyśmy przedstawić doświadczenia w PJWSTK w SLT zdobyte w projekcie EU-Bridge (VII PR EU) i działaniach konsorcjum U-Star dla pary języków polski / angielski. Przedstawione badania koncentrują się na adaptacji ASR dla języka polskiego (modele akustyczne: trening DBN-BLSTM, transformacje LDA + MLLT + SAT + MMI), modelowaniu języka  na potrzeby ASR & MT (normalizacja tekstu wykorzystująca sieci LSTM, domenowa interpolacja modeli n-gramowych) i statystycznych technikach tłumaczenia (modele hierarchiczne, modele z wykorzystaniem dodatkowych czynników (factored models), korpusy porównywalne i dwujęzyczne). Zagadnienia te wymagają przetwarzania ogromnych zbiorów danych, a trening modeli prowadzi się zazwyczaj na strukturach gridowych.

Prezentacja z wykładu (pdf, 2,38 MB)