Когда появится онлайн-переводчик крымтатарского языка?

25.09.201817:22

Мы с вами можем сократить это время до года. Но для этого нужно приложить усилия

Электронные словари и машинный перевод появились почти одновременно с персональными компьютерами. Они стали кирпичами в фундаменте цифровой революции, так как открыли возможности для переноса огромного объема знаний с одного языка на другой. Словари существенно облегчили и ускорили ручной перевод, так как позволяют в считанные секунды отыскать необходимое слово или подобрать синоним. 

Но они не решали задачу перевода текста целиком, поэтому сразу за словарями появились онлайн-переводчики. Первые переводчики были топорными, они не могли полноценно перевести текст, так как не были  основаны на словарях и главное, на правилах грамматики, которые у каждого языка разные. Они не могли перевести идиоматические выражения («съел пуд соли» или «мозолить глаза») или в случае отсутствия слова подобрать к нему синоним. Кроме того, правилами можно было задать перевод только с одного языка на один другой язык. Все это существенно ограничивало использование таких переводчиков.

С тех пор многое изменилось. Изменились и переводчики, они стали доступны для всех, а перевод возможен  почти с любого языка. Такие возможности появились благодаря интернету и технологиям перевода, основанным на статистическом анализе. Еще эту технологию называют машинным обучением.

Но многие языки по-прежнему находятся за гранью этой доступности. К ним относится и крымтатарский язык. Главной причиной этого является катастрофически малое количество материала на крымтатарском языке с переводом на любой другой язык. Дело в том, что переводчик на основе статистического анализа не создается в ручную, а обучается. В него загружаются тексты с переводами, где каждое слово языка должно употребиться десятки раз в разных контекстах его использования. На основе множества текстов электронный переводчик создает модель языка, где слова или целые фразы связаны с контекстом их применения. Поэтому необходимо разыскать большое количество материала на крымтатарском языке с переводом на любой другой язык.

Для этой цели нам подойдут: проза, поэзия, религиозные книги. Острая нужда в учебниках и научных трудах, где встречаются спецтермины. Статьи и тезисы. Подойдут все имеющиеся статьи с переводом. Очерки о природе, философии, политике, религии, науке, домашнем быте, скотоводстве, земледелии. Такое разнообразие обеспечит правильный перевод для различных случаев использования переводчика.

В открытом доступе в электронном виде этого материала нет.

И собрать его может показаться невыполнимой задачей.

Но это возможно. Депортация крымских татар вырвала из культурной жизни целый народ на десятилетия. Но наша культура и язык не были утрачены, а это главное. За последние десятилетия, после возвращения крымских татар, выходило множество печатных изданий на родном языке, учебники, научные труды, пресса. Было переведено или переиздано множество книг с художественной литературой. Все это содержит в себе то необходимое разнообразие языка и может быть использовано для создания автоматического крымтатарского переводчика. Работа над переводчиком уже начата. Этим занимаются энтузиасты, которым не безразлично будущее своего народа и своего языка.

Основной источник материала – это бумажные книги. Был собран список крымтатарской литературы с переводами на другие языки. Уже отсканировано большое количество книг, имеющих переводы. Сейчас ведется работа по оцифровке текстов из этих книг. Отсканированная копия книги выглядит как набор фотографий каждой страницы. Такой формат для создания переводчика не подходит, для компьютера сканкопия выглядит как рисунок, поэтому его нужно превратить в электронный текст. Для этого при помощи специальной программы мы распознаем текст на сканкопиях книг. Это тот этап, на котором мы сейчас находимся и нам в этом нужна ваша помощь. Следующие крупные этапы – это проверка орфографии и синхронизация переводов. Здесь мы хотим уменьшить до минимума человеческий труд, оставив большую часть работы компьютеру.

Сейчас мы ищем волонтеров, которые готовы посвятить немного своего свободного времени на то, чтоб уровень крымтатарского языка шагнул на следующую ступень – стал доступным во всех смыслах.

Считается, что человек, занимающийся профессиональными переводами при помощи электронного переводчика, переведет книгу в 2 раза быстрее, а это означает, что число профессиональной литературы на крымстатарском языке как минимум удвоится. У людей, не владеющих языком появится шанс что-то прочитать на крымтатарском, воспользовавшись онлайн-переводчиком.

Изучение языка станет во много раз проще, а это шаг к его сохранению.

Те, кто был на форуме «Devam», помнят сколько разговоров и идей было для сохранения языка. Вот один из путей, который поможет продвигать крымтатарский язык в будущем.

Предложить свою помощь можно присоединившись к группе QIRIMTATAR Tİlİ ONLİNE TERCİMECİSİ в Facebook и обратившись к Pavlo Bashynskyi или на электронную почту onlinetercimeci@gmail.com.

Нужно понимать, что рано или поздно переводчик появится, но стоит вопрос времени. Без сторонней помощи он может появится через 10-20 лет, когда в интернете появится критическая масса материала для создания переводчика.

Мы с вами можем сократить это время до года. Но для этого нужно приложить усилия.

Эсмера АСАНОВА

Мнение автора может не совпадать с мнением редакции 

Подписывайтесь на наши страницы в соцсетях FacebookВконтактеОдноклассникиInstagram   и будьте в курсе самых актуальных и интересных новостей.

Фото аватара

Автор: Редакция Avdet

Редакция AVDET