Что такое файл SDLXLIFF?
Современные переводческие рабочие процессы во многом основаны на CAT-инструментах (инструментах машинного перевода с участием человека). Одним из наиболее широко используемых в отрасли CAT-инструментов является SDL Trados Studio, которая хранит двуязычный переводческий контент в формате SDLXLIFF.
SDLXLIFF — это двуязычный формат файлов на основе XML, используемый SDL Trados Studio. Формат основан на стандарте XLIFF (XML Localization Interchange File Format), широко применяемом в рабочих процессах локализации. Каждый SDLXLIFF-файл содержит: исходные текстовые сегменты, целевые переводы, теги форматирования, сведения о статусе сегментов, комментарии и метаданные, а также совпадения с памятью переводов.
Внутри SDL Trados Studio эти сегменты отображаются в двуязычном редакторе, где переводчики работают посегментно. Вне CAT-инструментов SDLXLIFF-файлы сложны для чтения из-за сложных XML-структур и встроенных тегов форматирования.
Почему переводчики конвертируют файлы SDLXLIFF в Excel
Несмотря на всю мощь SDLXLIFF-файлов внутри CAT-инструментов, переводчики, менеджеры проектов и специалисты по контролю качества нередко нуждаются в анализе данных перевода вне CAT-среды. Именно здесь на помощь приходят рабочие процессы на основе Excel.
1. Удобная проверка сегментов
В Excel переводчики могут быстро просмотреть весь документ в виде структурированной таблицы — номер сегмента, исходный текст и целевой перевод — что существенно упрощает быструю ревизию переводов.
2. Терминологический анализ
Excel позволяет искать, фильтровать и анализировать терминологию. Например, можно проверить, последовательно ли переведён конкретный термин по всему документу.
3. Проверка качества
Специалисты по контролю качества регулярно выполняют такие проверки, как: пропущенные переводы, непоследовательная терминология, дублирующиеся сегменты, несоответствие чисел и ошибки пунктуации. Excel предоставляет мощные инструменты — фильтры, формулы и условное форматирование — для выявления проблем.
4. Сотрудничество с пользователями без CAT
Многие клиенты, рецензенты или тематические эксперты не пользуются CAT-инструментами. Excel-файлы позволяют им рецензировать переводы, добавлять комментарии и предлагать исправления, что значительно упрощает совместную работу.
Типичные рабочие процессы QA с Excel
Excel играет важную роль в рабочих процессах контроля качества перевода.
Выявление пропущенных переводов
Если сегмент содержит исходный текст, но не имеет перевода, фильтры Excel быстро обнаружат проблему.
Проверка числовой согласованности
Технические переводы часто содержат числа: единицы измерения, номера версий и технические параметры. Специалисты по QA могут использовать формулы Excel для выявления расхождений между числами в источнике и переводе.
Обнаружение дублирующихся переводов
Дублирующиеся сегменты, как правило, должны иметь идентичные переводы. Excel упрощает сравнение таких сегментов.
Соответствие терминологии
Менеджеры проектов нередко ведут утверждённые терминологические списки. С помощью Excel можно проверить, правильная ли терминология использована.
Сложности при работе с файлами SDLXLIFF
Хотя SDLXLIFF-файлы содержат структурированные данные, работать с ними вне CAT-инструментов не всегда просто.
- Сложные XML-теги: файлы SDLXLIFF содержат множество тегов форматирования, сохраняющих исходный макет документа, что затрудняет ручное чтение и анализ.
- Структура сегментирования: каждый сегмент содержит дополнительные метаданные: статус перевода, уровень подтверждения и информацию о совпадениях. Извлечение только нужного переводческого текста требует корректного разбора.
- Большой размер файлов: крупные переводческие проекты могут содержать тысячи сегментов, что делает ручной анализ неэффективным.
Способы конвертации файлов SDLXLIFF в Excel
Способ 1: Ручной разбор XML
Поскольку SDLXLIFF основан на XML, технически его можно открыть в текстовых редакторах. Однако вручную извлечь пригодные для использования данные перевода крайне долго.
Способ 2: Собственные скрипты
Некоторые переводчики используют Python или другие скрипты для извлечения переводческих сегментов. Этот подход эффективен, но требует знания программирования.
Способ 3: Специализированные инструменты конвертации
Наиболее эффективный подход — использовать специализированный инструмент конвертации, разработанный для CAT-файлов. Инструменты, понимающие структуру SDLXLIFF, могут быстро извлечь исходные и целевые сегменты в структурированные таблицы.
Конвертация файлов SDLXLIFF с помощью конвертера Linigu
SDL Converter на linigu.cloud обеспечивает простой способ конвертации файлов SDL Trados в читаемые форматы Excel или Word. С помощью простого процесса загрузки переводчики могут быстро преобразовать SDLXLIFF-файлы в структурированные таблицы с исходными сегментами, целевыми переводами и двуязычными парами переводов.
Это значительно упрощает проверку качества переводов, анализ терминологии, проверку проектов и переводческие аудиты. Конвертер особенно полезен для переводчиков, которым нужно проверять данные перевода вне SDL Trados Studio. После регистрации пользователи могут быстро конвертировать файлы и мгновенно просматривать их в Excel или Word.
Лучшие практики QA для SDLXLIFF в Excel
Раздельные столбцы для источника и перевода
Всегда используйте чёткие отдельные столбцы для исходного и целевого текста во избежание путаницы.
Фильтры для более быстрого контроля качества
Фильтры позволяют быстро выявлять пустые ячейки, дублирующиеся сегменты и конкретные термины.
Выделение потенциальных ошибок
Условное форматирование помогает обнаружить отсутствующие знаки пунктуации, непереведённые сегменты и непоследовательное форматирование.
Контроль версий
При передаче Excel-файлов рецензентам отслеживайте различные версии, чтобы не потерять исправления.
Заключение
Файлы SDLXLIFF являются основой многих профессиональных переводческих процессов в SDL Trados Studio. Однако анализировать переводческие данные непосредственно в CAT-инструментах не всегда наиболее эффективно для контроля качества и терминологического анализа. Конвертируя SDLXLIFF-файлы в таблицы Excel, переводчики и менеджеры проектов получают мощные инструменты для проверки сегментов, выявления ошибок и совместной работы с рецензентами, которые не используют CAT-ПО. Такие инструменты, как SDL Converter на linigu.cloud, значительно упрощают этот процесс, позволяя быстро конвертировать файлы SDL Trados в двуязычные форматы Word или Excel.