Системи машинного перекладу

030

Машинний переклад значно дешевший і швидший від традиційного, хоч і поступається йому за якістю. Ним користуються в тих випадках, коли важливіше зрозуміти зміст документа, ніж перекласти текст відповідно до літературних критеріїв. Машинний переклад обіцяє стати важливим інструментом для розвитку міждержавної торгівлі, тому що він спроможний значно спростити і прискорити одержання інформації про товари, що випускаються в інших країнах. Останнім часом в цій галузі досягнуто значних успіхів.

Розрізняють два магістральні напрямки створення та застосування машинного перекладу. В першому випадку система машинного перекладу функціонує на великій ЕОМ і дає “сирий”, чорновий переклад, який згодом редагують кваліфіковані перекладачі. Як правило, така методика використовується у великих організаціях, які змушені готувати документи різними мовами. Деколи досить успішно використовується попереднє редагування вихідних текстів. Деякі фірми вводять у себе так звані “контрольовані природні мови”: коли кожен працівник фірми, що готує документацію, повинен її готувати саме з дотриманням вимог цієї обмеженої мови (наприклад, вимога відсутності складних синтаксичних конструкцій). Використання контрольованої природної мови спрощує роботу машинного перекладу і зменшує обсяги постредагування, яке дорого коштує через необхідність залучення спеціалістів високої кваліфікації. Другим магістральним напрямком машинного перекладу є використання систем, орієнтованих на персональні комп’ютери. Такі системи вперше з’явилися ще на початку 1980-х років (наприклад, MicroCAT фірми Weidner). Найбільший успіх в застосуванні цих систем перекладу припав на 90-і роки.

Статистичні оцінки підтверджують постійне зростання продаж систем машинного перекладу. На ринку зараз знаходиться понад тисячу різних пакетів (якщо враховувати окремо кожну мовну пару). Популярність машинного перекладу пояснюється не тільки простою цікавістю, хоча і це є однією з основних причин поширення систем машинного перекладу. Велика частина користувачів використовує невідредагований машинний переклад текстів великих обсягів з метою ознайомлення, коли низька якість перекладу цілком допустима.

Сучасні системи перекладу пропонують користувачам приблизно однаковий спектр можливостей:

– редагування тексту в багатомовному режимі з розбиттям екрана так, що в кожному вікні знаходиться текст відповідною мовою;

– розпізнавання термінів;

– пошук слів у словниках, вставка перекладів у текст;

– так звана “пам’ять перекладача” — переклад з використанням нагромадженого досвіду;

– створення паралельних двомовних текстових баз даних;

– збереження форматування;

– підтримка великого спектра європейських мов.

Зараз інтенсивно проводяться дослідження в галузі перекладу усної мови. Компанія IBM, яка вважається лідером в цій області, випустила програмний пакет ViaVoice 4.1, який дозволяє комп’ютеру сприймати до 140 слів на хвилину неперервного диктування. Попередні версії цієї програми передбачали лише дискретний спосіб введення мови. Для налагодження на персональні особливості мовлення певної людини при початковому установленні програми в залежності від якості вимови і конкретного діалекту потрібно повторити від 104 до 256 речень, що попередньо задаються. Але розпізнавання мови не означає розуміння її змісту. Слід розрізняти розпізнавання машинної мови і перетворення її в текст або ж її використання у вигляді команд, і справжнє розуміння її змісту, як це робить людина. Останнє вимагає знання комп’ютером всього обсягу стилістичних та семантичних конструкцій, правил використання слів та висловів, причому останні повинні задаватися не жорстко – адже люди говорять, що завгодно і як завгодно, не звертаючи уваги наскільки це грамотно і літературно. Іноді навіть те, що говориться, не відповідає тому, що малося на увазі. Так що навчити машину розуміти людей – задача незрівнянно складніша і віддалена в часі.

В. П. КОЖЕМ’ЯКО, В. В. ДМИТРУК, Н. В. БЕЛІК

НАУКА І ТЕХНІЧНА ТВОРЧІСТЬ В НАВЧАЛЬНОМУ ПРОЦЕСІ (ВІД АБІТУРІЄНТА ДО АСПІРАНТА)

Оставьте комментарий к статье