ОТ НЕЭЛЕКТРОННОГО ПЕРЕВОДЧИКА К ЭЛЕКТРОННОМУ, или ПРИНЦИП ЭФФЕКТИВНОСТИ ПО ЗАТРАТАМ

20-07-2005

Мы не боимся, что нас заменят программами-переводчиками, по крайней мере, пока существуют человеческие языки со всей их нелогичностью, многозначностью и метафоричностью. И лучшим доказательством того, что мы в них не верим, является то, что мы, живые переводчики, их не покупаем.

Инна Ослон: «Записки неэлектронного переводчика»

Участники дискуссии придерживаются весьма распространённого мнения, смысл которого состоит в том, что переводчик, берущийся переводить текст в какой-то области, должен быть специалистом в этой области. Смею утверждать, что это совсем не обязательно.

Виктор Шевелев: «Записки еще одного неэлектронного переводчика»

Сабирджан КурмаевЦитаты выше принадлежат «техническим» или универсальным переводчикам, которые переводят все, что судьба пошлет, от устройства ватерклозета до размножения бабочек. Почти все. Художественной литературой они не занимаются. Хотя там тоже есть свои поденщики, промышляющие детективами, но никто не усомнится в том, что Шекспира переводят мастера высокого класса. Мастерам художественного перевода не приходится переключаться с механической терминологии на электротехническую. Их область – беллетристика. Но – это уже искусство, для него нужно призвание, а кроме призвания нужно опять-таки быть специалистом в своей области: нужно знать язык и культуры места и времени действия переводимого произведения, нужно представлять себе культурное окружение, в котором находился автор произведения, познакомиться с его биографией. Технический перевод – ремесло, ему можно научиться. Как водится, в любом ремесле, есть в нем инструменты, облегчающие и ускоряющие работу. Порой без таких инструментов просто не обойтись. Инструменты со временем усложняются, количество исполняемых ими функций растет, а пользование ими упрощается. Наступает такой момент, когда инструменты усовершенствуются до такой степени, что для управления ими уже не нужен ремесленник, т.к. его функции автоматизировались. Это кошмар всех ремесленников еще с тех времен, когда луддиты громили ткацкие станки. Инструменты переводчика-традиционалиста – бумажные словари. Враги переводчика – электронные программы перевода с новыми возможностями. Вот и заклинают переводчики своих врагов: «Чур, чур, метафоричность вам не по зубам! Мы вас не покупаем!».

Хочется техническим переводчикам считать, что они тоже соприкасаются с искусством. К науке и технике им приближаться не хочется, а нужно наоборот. Техническому переводу отсебятина противопоказана, необходима точность попадания почти как в технике. Попробуйте написать название сайта Интернета, на который вы хотите попасть, но не точно, а так, как вам представляется правильным. И куда вы попадете? Во всяком случае, не туда. Технический переводчик-неспециалист постоянно находится в таком подвешенном состоянии. За отсутствием знаний он генерирует то, что ему представляется правильным. «Представляется» необязательно «является». Вот, живой пример переводческого творчества. Переводчику в тексте по фотографии встретилось такое утверждение о цифровой фотографии: «A negative or positive image can be transferred to paper and/or enlarged (NOT blown-up)». Противопоставлялось друг-другу «enlarge» – «увеличивать вообще» и «blow-up» - «увеличивать-раздувать» разговорное выражение, применяемое преимущественно в пленочной фотографии. Что имел автор в виду, сказать трудно, но переводчику нужно принять какое-то одно решение. Он обратился к товарищам по профессии на переводческом форуме. И, вот, что ему ответили: «В цифровом фото и видео вошла в моду HD-технология, согласно которой получается изображение повышенной четкости (High Definition), и его можно масштабировать в сторону укрупнения (enlarge) при сохранении деталями той же четкости (HD), которой обладает исходная электронная картинка, чего простое оптическое увеличение (blow up) не дает.» Тут все неверно: любое изображение состоит из отдельных элементов, которые становятся видны при определенном увеличении, пленочная фотография пока дает более высокое разрешение изображения, чем цифровая, да и технологии такой как HD в цифровой фотографии нет. Но, если на основании таких домыслов, переводчик сделает свой вывод, то и перевод у него будет неверным. Критерия проверки правильности у него нет за отсутствием знаний.

Но переводчики для собственного успокоения упорствуют и повторяют еще одно заклинание: «Мы не обязательно должны разбираться в том, что мы переводим». Можно довести это заклинание до абсурда если «посметь утверждать», что для перевода вообще ничего не нужно знать, даже с какого языка переводишь. Только какой получится перевод? Но на моей памяти такой случай был. Один мой сокурсник в институте был во французской группе и сдавал "тысячи знаков" по газете "Les Nouvelles de Moscou". Однажды он по ошибке купил "Moscow News" на английском языке, что не помешало ему "перевести" что-то на политическую тему, чем он немало потешил свою преподавательницу. Он рассказал нам, что у него вызвали некоторые затруднения необычные окончания обычных слов, но он не стал обращать внимание на несущественные мелочи, домыслил незнакомые слова и составил свой текст.

Если рассматривать этот тезис не в юмористическом плане, то это типичное рассуждение «плоскатика». Понятие «плоскатика» было введено Гельмгольцем, чтобы показать различие в восприятии мира существами разной мерности. «Плоскатик» – это воображаемое существо, живущее в плоскости стола. Понятия длины и ширины для него актуальны. А вот категории третьего измерения – высота или глубина –, для «плоскатика» yмонепостигаемы. Переводчик, не понимающий переводимого текста, не может осознать важности научно-технических знаний. «Да, – рассуждает он, – недурственно бы это знать, но это нереально, а потому и не обязательно».

В двумерном пространстве, в котором вынужден обитать переводчик-«плоскатик» две координаты: затраты на продукцию и ее количество. Качество должно быть настолько высоким, чтобы продукцию можно было продать, но не более того. Чем выше качество, тем дороже продукция, поэтому затраты на ее единицу необходимо снижать до границы возможного. Ключевое понятие – эффективность по затратам. Вот, пример из жизни. Мне как-то пришлось переводить на переговорах между шведским производителем оборудования для производства железобетона с Латвийской железной дорогой. В Даугавпилсе после Советов остался завод железобетонных изделий. Латвийская дорога хотела бы использовать его как базу для размещения шведской линии производства шпал. Но после обследования объекта, шведы пришли к заключению, что существующее оборудование не годится для использования, существующее здание, скорее всего, тоже. Советская технология предполагала обеспечение максимальной прочности шпал, для чего они пропаривались в автоклаве, а для упрощения производственного цикла корпуса цехов были большой высоты, наверху у потолка ходил по рельсам кран. Шведская технология исходила из максимального удешевления производства. Вместо энергоемкой пропарки в бетон добавляют специальные химикаты, а само производство размещают в цехах с низкими потолками с тщательно герметизированными дверями, что позволяет экономить электроэнергию на отопление. Шпалы получаются заведомо худшего качества, чем при пропарке, но зато гораздо более дешевыми. Торжествует принцип эффективности по затратам.

Применительно к переводам принцип эффективности по затратам означает, что вместо того, чтобы искать специалистов для каждого текста или, тем паче, для каждой его части дешевле будет использовать широкое предложение универсалов, которым все едино, что жуки природные, что «жучки» в электросчетчиках, что «жучки» в программном обеспечении. Чтобы увеличить эффективность по затратам агентство по переводам может разделить текст на части и раздать его разным переводчикам. Неважно, что отдельные части не очень стыкуются, плата за срочность получена, клиент работу взял, результат в денежном выражении налицо. Вот, и приходится специалистам разбирать, что именно подразумевается под тем, что написал универсал.

Универсалу не очень приятно признаваться в том, что выбирают его по чисто экономическим соображениям. В той статье Ослон (если кому-то интересно познакомиться с этим образцом самоуверенной наивности, то его можно найти по адресу: http://www.vestnik.com/issues/2002/0710/win/oslon.htm) есть и такой перл:

«Но не всегда на переводе можно экономить. Как недавно выяснилось, еще до 11 сентября в ФБР пылилась куча перехваченных разговоров арабских террористов, да некому было их считывать. На необычайно дорогое оборудование потратились, а на человеков-переводчиков поскупились. А я как налогоплательщик лучше бы заплатила высокопрофессиональным арабистам, чем ликвидаторам развалин.»

Это объяснение не лучше той шутки, что арабские террористы так много наговорили благодаря недорогим семейным планам для мобильных телефонов со скидками на вечерние часы и субботу с воскресеньем. Невдомек Ослон, что для такой задачи годится не каждый переводчик. Нужно еще одно специальное качество. Переводчик должен иметь допуск к секретным материалам. А таких арабистов оказался дефицит. После того, как в 2000 году агент Аль Каиды Али Мохамед, проникший в армейские силы специального назначения США, был осужден по делу о взрывах в американских посольствах, американцам арабского происхождения стали меньше доверять. Есть, правда, евреи, владеющие арабским языком, но, как на грех, это сефарды из арабских стран, глубоко религиозные, настолько глубоко, что они не могут отречься от израильского гражданства, чтобы принять американское. А граждане иностранного государства не могут быть допущены к работе с оперативными секретными материалами, даже если иностранное государство – Израиль.

Универсал отгораживается от электронных переводчиков и гордится своим языковым чутьем. Подразумевается, что у тупой машины никакого чутья нет, и не будет. Однако, вспомним, что совсем недавно никто не мог бы поверить, что компьютер обыграет Гарри Каспарова. Предполагалось, что живой шахматист обладает каким-то шахматным чувством, а машина всего лишь перебирает варианты. И, тем не менее... Разница в том, что машина перебирает все возможные варианты, а человек – те варианты, с которыми он знаком, а из них выбирает те варианты, что принесли ему успех в сходной обстановке. Так работает «языковое чутье»: переводчик-универсал, не понимая текста, ищет варианты, сходные с теми, которые помогли ему в прошлом. Если он имеет дело не с принципиально новыми разработками, а переводит в области, где можно найти нечто аналогичное (неважно, что это – плоскошлифовальные станки или лебедки, главное, чтобы были подходящие «болванки» на которых можно будет построить аналогию), то у него есть шансы сделать удовлетворительный перевод. Теперь, с появлением Интернета, поиск «болванок» значительно упростился: не нужно листать тома специальной литературы в поисках взаимной сочетаемости тех или иных понятий. Достаточно напечатать нужные слова в окне поисковой системы Google и, далее, руководствуясь «языковым чутьем», а точнее «методом тыка» дополненного опытом предыдущей работы отбирать нужные варианты. Ну, а если, интернетный или книжный поиск не дал подходящего варианта? Тогда универсалу остается только обратиться к специалисту за справкой. Круг замкнулся. Без специальных знаний, хотя бы чужих, не обойтись.

В некотором упрощении две основные трудности поиска нужных понятий сводятся к двум полярным вариантам:

  1. такого слова (словосочетаний) в словарях нет;
  2. словари дают несколько вариантов перевода.

Нетрудно заметить, что как бы благоприятный вариант, когда словари дают однозначное толкование, не дает гарантии правильного перевода. Толкование есть, но где гарантия, что это то самое, что нужно? Ведь, словари составляются на основании устоявшейся практики, после чего проходит время на работу над словарем и его изданием и, все что появилось в этот промежуток времени, уже словарем не отображается. Так, что даже если переводчику приходится иметь дело не с новыми исследованиями и открытиями, словари, которыми он пользуется, устарели к моменту своего выхода в свет. В узком смысле это означает то, что если нужный термин найти не удается, переводчику остается изобрести свой, а в широком смысле ставит под сомнение перевод универсалами неординарных текстов. Иными словами, если универсал делает перевод руководства по работе какой-нибудь машины из ряда тех, что давно опробованы и существуют, то шансов справиться с такой задачей у него гораздо больше, чем перевести научное исследование из новой области знания.

Электронный переводчик сталкивается со своими специфическими трудностями. Человек видит слова в контексте. Например, в тексте, переводимом с русского языка, встретилось слово «линии».
Синтаксически это может быть:

  1. существительное единственного числа в:
    a. родительном падеже,
    b. дательном падеже,
    c. предложном падеже;
  2. существительное множественного числа в:
    a. именительном падеже,
    b. винительном падеже.

Семантически могут быть более десяти значений этого слова. Но переводчик (электронный тоже) имеет дело не с отдельными словами, а с их совокупностью, что многократно усложняет задачу. Синтаксис сравнительно легко поддается формализации, с семантикой дело обстоит сложнее. Пока не найдено безупречного общего решения электронного перевода. В настоящее время к нему приближаются по двум направлениям:

  1. собственно машинный перевод – МТ (Machine Translation), при которой переводчик поддерживает компьютер, т.е. программа переводит текст, который затем редактирует переводчик. Такой подход хорош для тех, у кого сильная сторона – знание предмета. Переводчик получает сырой текст, который он дорабатывает, основываясь на своих специальных знаниях;
  2. перевод с помощью компьютера – САТ (Computer Aided Translation), при которой переводчик принимает все основные решения, компьютер лишь поддерживает переводчика. Компьютер не делает полного перевода, а дает переводчику возможность выбрать соответствующую терминологию и образцы переводов, которые сам переводчик ранее внес в базу данных – так называемую «переводческая память». Кроме того переводчик создает с помощью «менеджера терминологии» словарь терминологии со многими дополнительными функциями. Поэтому, получаемые от компьютера, результаты зависят от самого пользователя. Такая система – хороший помощник для профессионального переводчика и, по сути дела, представляет собой усовершенствованный подход к электронной обработке текста.

Разработка электронного перевода начиналась полвека назад с МТ в 1954 году и, соответственно духу времени, применялась для разбора текстов советских журналистов, работающих в научных областях. Получаемые черновые переводы давали возможность оценить суть текста. Если он представлял интерес, то его отсылали живому переводчику, если нет, то отбраковывали.

Хотя программы МТ появились еще до текстовых редакторов, электронной почты и даже интерфейса с командной строкой, тем не менее, в настоящее время они не столь распространены. Не удалось создать коммерчески приемлемую систему, в которой перевод с любого языка производится на промежуточный «внутренний» язык системы, а с него уже на любой человеческий. Такая система была бы универсальной, но пока переводы осуществляются только внутри языковых пар. Говорят, что первоначальный энтузиазм угас после того, как военное ведомство оскандалилось переводом русского изречения «Дух силен, но плоть слаба» в виде «The vodka is good but the meat is rotten», т.е. в обратном переводе: «Водка хороша, но мясо протухло». В настоящее время практически единственное место, где широко используется МТ – это структуры Европейского Союза, где он является базовой системой для выработки черновых документов, которые потом доводятся специалистами до нужной кондиции. Европейский Союз использует продукты Systran. Поисковые системы Интернета также применяют модификации Systran для перевода результатов поиска. Познакомиться работой этой системы можно на сайте компании по адресу http://www.systranbox.com/, где можно для пробы перевести небольшой текст в сто пятьдесят слов. Среди прочих языковых пар там есть и две пары перевода с русского на английский и с английского на русский. Интересно, что в рекламе своих продуктов Systran, упоминает то, что их использование представляет «значительную экономию по сравнению с традиционными переводческими услугами». На российском рынке лидером в разработке МТ является петербургская фирма Prompt (расшифровывается как сращение двух слов: Pro – профессиональный MT – машинный перевод). В начале 90-х годов ею было создано семейство программ-переводчиков Stylus. Сейчас она выпускает одноименный с названием фирмы продукт Prompt. Попробовать его возможности можно по адресу http://www.translate.ru/text.asp?lang=ru. Естественно, что Prompt дает не две пары для русского языка, а спаривает его с основными европейскими языками. Кроме того имеются пары составленные из европейских языков.

В то время как МТ как бы находится на старых позициях, системы САТ успешно развиваются. Они, по сути дела, представляют собой мощные инструменты в руках переводчика. Переводчик работает с САТ в интерактивном режиме, чем они выгодно отличаются от традиционных словарей, тем более, бумажных. Вот, как рекламирует преимущества своей системы ведущий разработчик САТ Trados:

  • вам никогда не придется переводить одно и то же предложение дважды;
  • вы повысите точность и последовательность ваших переводов;
  • вы уменьшите время, потребное на перевод, на 50% или более;
  • вы сможете делать гораздо более точные оценки стоимости перевода и времени, потребного на него;
  • вы сможете делиться своей переводческой памятью с другими переводчиками в режиме онлайн;
  • вы будете пользоваться преимуществами, знакомых вам интерфейса и сервисов Microsoft Word;
  • вы будете работать в обществе тысяч переводчиков, переводческих бюро и предприятий, использующих систему Trados.

Итак, если отбросить последнее «преимущество» Trados’а, то все сводится опять-таки к соотношению стоимости и эффективности. МТ в чистом виде дает приемлемые результаты при работе с предсказуемыми техническими текстами, которые никогда не выходят за пределы ожидаемой предметной области. Таким образом, компания, производящая какую-то линию совершенствуемых продуктов, для перевода их описаний может сэкономить на переводчиках-ремесленниках. Потребуется только редактор – специалист в данной отрасли.

А вот какую интегрированную переводческую среду предлагает система Deja vu:

  • Функция Сканирования Deja vu моментально проверяет как определенное предложение или словосочетание было переведено в прошлом;
  • Мощная функция Сборки Deja vu подбирает подходящие фрагменты или предложения со сходной структурой для построения перевода из материала, содержащегося в вашей базе данных;
  • Предварительный перевод Deja vu автоматически подбирает наилучший перевод для каждого предложения;
  • После того как предложение переведено Распространение Deja vu может проверить оставшуюся часть проекта на наличие идентичных предложений и автоматически вставить их перевод;
  • Автопоиск Deja vu может показать уже переведенные предложения, отрывки и термины из вашей базы данных со всей необходимой контекстной информацией, разумно рассортированные по значимости;
  • Управление проектом Deja vu позволяет видоизменить ваш проект для нужд других его участников в процессе достижения эффективной совместной работы;
  • Контроль качества Deja vu предоставляет эффективные средства для достижения согласования переводов по всему проекту как для переводчиков, так и для менеджеров проекта;
  • Единое переводческое пространство Deja vu подстраиваемое для всего проекта;
  • Поддержка многих форматов файлов;
  • Пакетное преобразование Deja vu позволяет одновременно вносить изменения в работу любого количества пользователей или всего проекта в целом;
  • Ведение терминологии Deja vu построено согласно концепции комплексной и полностью конфигурируемой базы данных, позволяющей ввести любое количество атрибутов при любом количестве категорий, которые необходимы вам, чтобы соответствующим образом определить терминологию;
  • Содержание баз данных Deja vu оперирует утилитами повышающими уровень безопасности и сохранности многоязычных баз данных.
  • Выравнивание Deja vu дает возможность извлекать ценные наработки из ваших предыдущих переводов;
  • Проектный лексикон Deja vu – перечень слов и фраз специфичных для определенного проекта, распространяется руководителем проекта как глоссарий единый для всех переводчиков, участвующих в проекте.

САТ особенно полезен для больших переводческих проектов, которыми обычно занимаются большие организации. Для них первоначальные затраты будут окупаться уже в середине работы. Повторяющиеся технические тексты особенно хорошо подходят для САТ. В частности это вызвано необходимостью в последовательности при переводе терминов и сходных блоков текста, что решается с помощью сравнения при нечетком совпадении. Следует учесть, что руководства пользователей также часто обновляются, и при обновлениях нередко используется много повторений из предыдущей версии. Но и мелкие и нетехнические переводы могут выиграть от САТ. Многие виды нетехнических текстов, к примеру, новостные репортажи, содержат значительное количество повторений.

Современные электронные словари начинают использовать элементы переводческой памяти. Популярная словарная система Мультитран потому и завоевала признание, что пользователи могут вносить в него свою терминологию. В Мультитране также присутствует другой элемент переводческой памяти поиск словосочетаний, а не только отдельных слов. Сетевой адрес Мультитрана http://www.multitran.ru/, там можно протестировать его возможности. Другая словарная система Лингво дает возможность пользователю подключать не только новые словарные статьи, но целые словари. Кроме того, Лингво снабжен функцией полного поиска словосочетаний внутри текстов (не по заголовкам!) словарных статей, функцией абсолютно немыслимой для бумажных словарей – при этом доступны элементарные настройки поиска (И или ИЛИ, можно задать расстояние между словами сочетания, искать в заданном порядке или в произвольном, искать все словоформы или только в том виде как введено в поиск). Так что, современные переводчики уже активно пользуются системами электронного перевода, даже если они этого и не осознают.

А как в будущем?

Перспективы полного машинного перевода – МТ неясны. Есть радикальное мнение, что он отомрет. Вероятно он все же будет продолжать существовать, поскольку он находит применение, и в этом направлении многое уже сделано. Но область, в которой он будет применяться не будет столь амбициозно широкой, как это виделось при его зарождении полвека назад. Скорее всего МТ будет продолжать использоваться для черновой работы, отбирая заработок у самых неквалифицированных переводчиков. Возможно, МТ будет совершенствоваться за счет заимствований из САТ. Уже сейчас Google в своей системе МТ пользуется результатами поиска сходных текстов в Интернете для сравнения при нечетком совпадении, что повысило качество его машинного перевода.

Перевод, сделанный с помощью компьютера – САТ продолжает успешно развиваться, его влияние на положение «неэлектронных переводчиков» будет усиливаться. С одной стороны усилится давление, т.к. САТ будет отбирать работу у индивидуальных переводчиков и будет устанавливать новые повышенные требования к результатам перевода, как по качеству, так и по срокам исполнения, что, в свою очередь, повлияет на расценки в сторону их уменьшения. Отдельные переводчики также будут интегрироваться в системы САТ, например, переводческое бюро могут продолжить практику «нарезания» большого текста на части с раздачей их отдельным переводчикам. Но это будет делаться на новом технологическом уровне, переводчики смогут сделать работу довольно быстро и качественно, будучи подключеными к общей переводческой памяти и терминологическому менеджеру через Интернет. Естественно оплата такого труда будет ниже, чем при индивидуальной работе.

Давно прошли времена, когда орудиями труда переводчика была ручка или, в лучшем случае, пишущая машинка и несколько пыльных словарей. Чтобы выдержать конкуренцию им придется пользовать многими средствами из репертуара электронного перевода. Уже сейчас ни один профессиональный переводчик не обходится без текстового редактора с проверкой орфографии и компьютерных словарей как локальных, так и выложенных в Интернете. Подключение к Интернету также необходимо для обмена электронными письмами, пересылки исходных и переведенных текстов, участия в сетевых конференциях и форумах, поиска образцов словоупотребления. Чтобы сохранить конкурентоспособность и обеспечить оптимальную эффективность по затратам, к этому нужно будет прибавить инструменты САТ, такие как Trados Workbench или Deja vu. Полная экипировка будет также включать систему оптического распознавания текста для работы с бумажными оригиналами и систему интерактивного распознавания голоса для диктования перевода компьютеру. Индивидуальным переводчикам придется претерпеть технологическую революцию. Проблема не в том, как победить компьютер, а в том, чтобы научиться эффективно его использовать.

Комментарии

Добавить изображение