Schyłek sensu segmentacji?

Schyłek sensu segmentacji?

13 maja 2024
Udostępnij:

Pod koniec lat osiemdziesiątych XX wieku, wraz z rozwojem technologii komputerowych, zaczęto opracowywać programy do wspomagania pracy tłumaczy pisemnych. Pozwoliły im one pracować szybciej, tworzyć bardziej spójne teksty przekładu i posiłkować się wcześniej przetłumaczonymi treściami. Dzisiaj rozwój technologii przyniósł branży tłumaczeniowej rozwiązania oparte na sztucznej inteligencji, które umożliwiają jeszcze szybsze, a niekiedy natychmiastowe, stworzenie przekładu o jakości zbliżonej do efektu pracy człowieka. Czy najnowsze osiągnięcia ułatwiają czy wykluczają pracę z tzw. CAT-ami? Postaram się odpowiedzieć na to pytanie poniżej.

O co chodzi z CAT-ami?

CAT to angielski skrót terminu computer assisted translation, a oprogramowanie CAT jest właśnie tym wspomnianym przeze mnie na samym początku artykułu. Korzystając z programów CAT, a jest ich obecnie na rynku co najmniej kilka, tłumacz przede wszystkim nie musi pracować w zwykłym edytorze tekstu. W programie CAT tekst, który ma być przetłumaczony, zwany tekstem oryginału, jest dzielony na segmenty, czyli w większości przypadków na zdania. Każdy z segmentów jest odpowiednio krótki, specjalnie podświetlony i umiejscowiony jeden pod drugim po lewej stronie ekranu komputera z miejscem po prawej stronie na samodzielne wpisanie tekstu tłumaczenia. Dzięki temu wzrok tłumacza nie gubi się w ciągach znaków tworzących całe akapity czy strony. Dostępne w programie CAT funkcje nie pozwolą też tłumaczowi przeoczyć żadnego zdania, co przy pracy w edytorze tekstu jest już prawdopodobne.

Wszystkie takie segmenty czy zdania w języku oryginału już w parze ze swoim tłumaczeniem są zapisywane w bazie danych obsługiwanej przez program CAT, którą nazywamy pamięcią tłumaczeniową. Takie zapisane pary oryginał-tłumaczenie mogą być później wielokrotnie wykorzystywane przy tłumaczeniu kolejnych tekstów, nawet jeśli nie są w 100% identyczne z nowymi treściami z tych tekstów. Prawdopodobieństwo ponownego użycia zapisanych tłumaczeń zwiększa się, jeśli tłumacz pracuje np. dla jednego klienta lub z tekstami z tej samej tematyki.

Na tym pokrótce zasadzałaby się podstawowa idea działania programów CAT. Oprócz tego zaspokajają one wiele innych potrzeb tłumacza, oferując na przykład słowniki terminologiczne, rozbudowane opcje autokorekty i weryfikacji oraz filtrowania.

Działania AI nie trzeba wyjaśniać

O ile przeciętny Kowalski nie miał nigdy do czynienia z programami CAT – bo te służą przede wszystkim do wspomagania specjalistów od tłumaczenia znających języki obce – o tyle bardziej prawdopodobne jest, że z różnych dostępnych narzędzi tłumaczeniowych opartych na AI już korzystał i nie potrzebował do tego żadnych specjalnych wyjaśnień ani znajomości języków obcych. Wystarczy na przykład, że znał adres strony internetowej, na której mógł skorzystać z usługi tłumaczenia maszynowego, wkleił w odpowiednie okienko tekst, który chciał przetłumaczyć i po chwili mógł już czytać i dalej kopiować tekst przekładu. A to wszystko nawet w darmowej wersji usługi.

Narzędzia tłumaczeniowe oparte na sztucznej inteligencji były też od początku znane także tłumaczom. Ci, znając zarówno język oryginału, jak i język przekładu danego tekstu, często nie mogli jednak zadowolić się pierwszą wersją tekstu tłumaczenia, jaką zaproponowała maszyna. Na przestrzeni kilku ostatnich lat jakość tych maszynowych tłumaczeń stale się poprawiała, mimo to nadal potrzebne jest ich weryfikowanie przez człowieka, szczególnie w sytuacjach, gdy celem tłumaczenia nie jest jedynie ogólne oddanie sensu tekstu.

Współpraca dwóch inteligencji

Tłumacze, pracując z narzędziami do tłumaczenia maszynowego dostępnymi online, musieli ingerować w jeszcze nieidealne teksty przekładu i mogli to robić już w chwili korzystania z samej usługi. Innymi słowy, nie musieli i nie muszą korygować tekstu przekładu osobno w edytorze tekstu na późniejszym etapie pracy.

W jednym z najbardziej znanych serwisów internetowych oferujących tłumaczenie z wykorzystaniem AI rzeczone ingerowanie wygląda tak, że tłumacz może postawić kursor przed fragmentem tekstu, który chciałby zmienić lub poprawić, i wtedy zostaną mu wyświetlone inne możliwe w tym miejscu wersje tłumaczenia. Wystarczy, że wybierze i kliknie na tę, którą uzna za najwłaściwszą. Jeśli takowa nie zostanie mu wyświetlona, może ją również wpisać samemu. I co jest tutaj najważniejsze: po dokonaniu takiej jednej zmiany przez tłumacza zostanie ona automatycznie zastosowana w dalszych partiach tekstu. Maszyna niejako współpracuje z człowiekiem i dostosowuje cały tekst przekładu do jego wyborów, co znacznie przyspiesza tworzenie tekstu przekładu. Przy takim tłumaczeniu maszynowym pisanie na klawiaturze ograniczone jest do minimum lub nawet do zera, a dzięki stosowaniu się przez maszynę do wyborów tłumacza uzyskany tekst przekładu zyskuje spójność.

AI & CAT

Na wykorzystanie rozwiązań AI w narzędziach CAT tłumacze nie musieli długo czekać. Dostawcy usług tłumaczenia maszynowego już od kilku lat oferują dodatkowe moduły rozszerzające możliwości programów CAT. Tak zwane „wtyczki”, bo o nich mowa, wstawiają gotowy tekst tłumaczenia w miejsce, w którym tłumacz musiałby wpisać ten tekst samodzielnie. Wyjątkiem będą oczywiście te sytuacje, w których tekst przekładu zostanie pobrany przez program CAT z wspomnianej wyżej pamięci tłumaczeniowej – wtedy nie ma mowy ani o tłumaczeniu maszynowym, ani o samodzielnym wpisywaniu – ale nadal nie będą to sytuacje częste.

Wtyczki znacznie przyspieszają pracę tłumacza w programie CAT, skracając czas poświęcany na pisanie na klawiaturze. Jakość proponowanego przez nie tekstu tłumaczenia także ciągle się poprawia, co bynajmniej nie oznacza, że ingerencja tłumacza w ten proponowany tekst nie jest konieczna. I właśnie w kontekście ingerencji w tekst tłumaczenia maszynowego w programie CAT można postawić sobie pytanie o sens segmentacji.

Każdy segment to inna bajka

Korzystając z narządzi do tłumaczenia bazujących na AI i dostępnych online, tłumacz może szybko i bez nadmiernego wysiłku całościowo korygować tekst przekładu we współpracy z maszyną, która dostosowuje się do jego wyborów. Wtyczki tłumaczenia maszynowego stosowane w programach CAT nie mogą zaś traktować tekstu całościowo, bo są „proszone” za każdym razem o przetłumaczenie tylko jednego segmentu, czyli najczęściej zdania. Nie może być więc mowy o tym, że inteligentna maszyna skoryguje treści poza tym jednym zdaniem, bo nie są jej one w danej chwili dostępne. Co więcej, to sam tłumacz musi z każdym kolejnym segmentem samodzielnie dokonywać korekty tekstu przekładu, co nie ma miejsca przy korzystaniu np. z internetowej usługi tłumaczenia maszynowego. Taką korektę musi zawsze wpisywać samodzielnie, bo w edytorze programu CAT nie może po prostu kliknąć i wybrać innego wyrazu z rozwijającej się listy.

Co w takim razie ze schyłkiem?

Jednym z najprostszych wniosków, do jakich można by dojść po przeczytaniu powyższego, byłby ten, że tekst przekładu tworzy się szybciej, wygodniej i prościej, korzystając z narzędzi do tłumaczenia opartych na AI. Tekst ten kreuje się, klikając i dokonując wyborów, bez zbędnego pisania. Natomiast praca z tekstem wprowadzonym do programu CAT, gdzie zostaje on podzielony na segmenty i nie może być całościowo traktowany przez inteligentną maszynę, nie wydaje się już w tym momencie tak płynna, sprawna i szybka. Starając się odpowiedzieć na pytanie postawione w tytule artykułu, można się więc pokusić o stwierdzenie, że nie ma już większego sensu korzystania z segmentacji w programach CAT w obliczu możliwości, jakie daje AI.

Gdybym miał na co dzień tłumaczyć głównie tzw. teksty zwykłe i niespecjalistyczne, takie jak choćby ten artykuł, w pełni bym się z powyższym stwierdzeniem zgodził. Treści i zdania zawarte w artykule na blog firmowy raczej na pewno nie powtórzą się w kolejnych podobnych tekstach, jakie będę tłumaczył. Do tłumaczenia artykułu nie potrzebuję też żadnego specjalistycznego słownika terminologicznego ani zaawansowanych opcji weryfikacji, żeby np. sprawdzić czy nie pominąłem żadnych danych liczbowych.

Inaczej jest w przypadku tekstów specjalistycznych, a zwłaszcza opisów patentowych, jakie standardowo tłumaczę w JWP – ich treści lubią się powtarzać, a do pracy nad ich przekładem potrzebuję wszystkiego tego, co nie jest mi niezbędne do tłumaczenia zwykłego artykułu. Żeby zapewnić tłumaczenie w pełni jakościowe i spójne nie tylko w ramach jednego tekstu, ale także w ramach ogółu tekstów z tej samej dziedziny, sięgnę więc po zestaw CAT+AI, a nie samą AI, z uwagi na dodatkowe funkcje programów CAT. Korzyść z nich wynikająca przewyższa korzyść szybszego tłumaczenia z wykorzystaniem samej sztucznej inteligencji.

Czy w programach CAT będzie można kiedyś ominąć problem niecałościowego traktowania tekstu przez AI? W chwili pisania tego artykułu nie znalazłem żadnego rozwiązania technologicznego, które ten problem podejmuje, ale przy obecnym stopniu rozwoju nowych technologii myślę, że doczekamy się go prędzej niż później.

Treść artykułu ma na celu przedstawienie ogólnych informacji związanych z danym tematem. W przypadku konkretnej sprawy należy zasięgnąć specjalistycznej porady uwzględniającej indywidualne okoliczności.

Warszawa

JWP Rzecznicy Patentowi
ul. Mińska 75
03-828 Warszawa
Polska
T: 22 436 05 07
E: info@jwp.pl

NIP: 526 011 18 68
REGON: 010532597
KRS: 0000717985

Gdańsk

JWP Rzecznicy Patentowi
Budynek HAXO
ul. Strzelecka 7B
80-803 Gdańsk
Polska
T: 58 511 05 00
E: gdansk@jwp.pl

Kraków

JWP Rzecznicy Patentowi
ul. Kamieńskiego 47
30-644 Kraków
Polska
T: 12 655 55 59
E: krakow@jwp.pl

Wrocław

JWP Rzecznicy Patentowi
WPT Budynek Alfa
ul. Klecińska 123
54-413 Wrocław
Polska
T: 71 342 50 53
E: wroclaw@jwp.pl