ترجمه اسناد اسکن شده PDF در ترادوس 2015

هنگامی که بر روی فایلهای دیجیتال کار می‌کنید، فناوری ترجمه بسیار عالی است، اما اغلب اوقات در رویدادهای ترجمه این سؤال را از من می‌پرسند که چگونه می‌توان نسخه چاپی اسناد فیزیکی را با استفاده از  SDL Trados Studio ترجمه کرد. ظاهراً این موضوع در حوزه متون حقوقی بسیار رایج است و اغلب مشتریان به دلایل امنیتی، متون خود را به صورت فکس و یا چاپ شده ارسال می‌کنند. یک خبر خوب! ما در SDL Trados Studio 2015 کار کردن بر روی اسناد اسکن شده را راحت‌تر از قبل کرده‌ایم.

امکان کار کردن بر روی فایلهای PDF قابل ویرایش از نسخه ۲۰۱۱ تاکنون وجود دارد، اما اکنون در Studio 2015  یک نوع فایل جدید برای PDF گنجانده شده است که دارای سه نوع تنظیمات جدید برای  تشخیص متن PDF است. این تنظیمات امکان پردازش اسناد اسکن شده PDF، و تشخیص نوشتار درون آنها با استفاده از قابلیت تشخیص نویسه را فراهم می‌کند و نوشتار آن را برای ترجمه در ترادوس ۲۰۱۵ آماده می‌کند.

recognize-pdf-text

پس تصور کنید که یک مشتری نسخه‌ای چاپ شده از یک سند را به شما می‌دهد.  بعد از آن چه اتفاقی می‌افتد؟

با استفاده از این نوع فایل جدید، می‌توانید اسناد را اسکن کنید و به فرمت PDF درآورید و سپس تنظیمات مربوط به نوع فایل را در SDL Trados Studio 2015 از مسیر  File > Options > File Types > PDF > Converter پیکربندی کنید.

در این نوع فایل سه گزینه مختلف برای تشخیص نوشتار PDF وجود دارد:

  • Every character – برای PDFهایی طراحی شده است که هم حاوی نوشتار قابل ویرایش و هم نوشتار اسکن شده هستند.
  • Problem characters only – برایPDFهایی طراحی شده است که کاملاً نوشتار آنها اسکن شده است.
  • None – برایPDFهایی طراحی شده است که نوشتارشان قابل ویرایش است.

همچنین می‌توانید سایر تنظیمات مربوط به تبدیل از جمله “چیدمان”، “بازیابی تصویر”، “سربرگ و پاورقی” و “تشخیص جدول” را نیز پیکربندی کنید. برای آن که بدانید کدام یک از گزینه‌ها برای شما مناسب‌تر است، شاید بد نباشد که گزینه‌های مختلف را امتحان کنید.

باید به خاطر داشته باشید که کیفیت تبدیل OCR تا حد بسیاری به کیفیت PDF اسکن شده بستگی دارد. برای مثال، اگر وضوح نوشتار اسکن شده پایین باشد یا خطوط ناشی از فتوکپی در سندتان داشته باشید، افزونه OCRخوان به سختی می‌تواند نوشتار را به درستی پردازش کند.

هنگامی که تنظیمات را پیکربندی کردید، PDF اسکن شده را برای ترجمه در ویرایشگر ترادوس باز کنید (یا از طریق “پروژه جدید” و یا از طریق”ترجمه یک فایل تکی”).  بسته به پیچیدگی سند مبدأتان، می‌توانید هر جا که لازم باشد اصلاحات کوچکی را در نوشتار تشخیص داده شده مبدأتان درون استودیو انجام دهید. تنها مطمئن شوید که گزینه ‘Allow source editing’ در تنظیمات پروژه فعال است.

allow-source-editing

یکی دیگر از ترفندهای مفید پیش‌نمایش فایل مقصد در مایکروسافت ورد است تا ببینید که آیا نتیجه کار درست است یا خیر.  برای این کار می‌توانید یا از میانبر صفحه کلید  Ctrl+Shift+P، استفاده کنید و یا بر روی آیکون پیش‌نمایش در نوارابزار دسترسی سریع کلیک کنید:

preview-target-file

اگر لازم است که اصلاحاتی در فرمت‌بندی یا خطاهای مربوط به تشخیص لغت انجام دهید، من توصیه می‌کنم که این کار را در Word انجام دهید، سپس این سند را ذخیره کنید و آن را به عنوان فایل مبدأ جدیدتان در استودیو استفاده کنید. بدین ترتیب هنگامی که فایل مقصدتان را خروجی می‌گیرید، به راحتی می‌توانید فایل Word را به PDF تبدیل کنید.

فناوری OCR در این نوع فایل جدید از Solid Documents قدرت گرفته است. در مقایسه با فیلتر قدیمی ما برای PDF، این فناوری نه تنها تشخیص نویسه را دقیق‌تر می‌کند، بلکه نوشتار را از تصاویر با کیفیت خوب نیز استخراج می‌کند.

زبانهایی که در حال حاضر توسط این فناوری پشتیبانی می‌شود عبارتند از دانمارکی، هلندی، انگلیسی، فنلاندی، فرانسه، آلمانی، ایتالیایی، نروژی، لهستانی، پرتغالی، روسی، اسپانیایی، سوئدی و ترکی. ما می‌کوشیم تا زبانهای بیشتری را در آینده به این فناوری اضافه کنیم. برای اطلاعات بیشتر در مورد فناوری Solid OCR می‌توانید  اینجا را مشاهده کنید.

امیدوارم این ویژگی باعث شود که فایلهای PDF را راحت‌تر در استودیو ۲۰۱۵ ترجمه کنید. برای اطلاعات بیشتر، می‌توانید از کانال یوتیوب ترادوس دیدن کنید.



ارسال نظر

قسمت های ستاره دار (*) ضروری هستند (ایمیل شما منتشر نمی شود)

نظرات کاربران: