هوش مصنوعی

آموزش هوش مصنوعی برای مبتدی‌ها – بخش چهارم: ترجمه آنلاین عکس

در سه بخش قبلی این مجموعه، درباره‌ آشنایی با مفاهیم و کاربردهای هوش مصنوعی (بخش اول)، شیوه سؤال‌پرسیدن از هوش مصنوعی (بخش دوم) و ترجمه متن‌ها با کمک هوش مصنوعی (بخش سوم) صحبت کردیم.

در این بخش می‌خواهیم روی موضوعی تمرکز کنیم که برای خیلی‌ها کاربردی و جذاب است: «ترجمه آنلاین عکس» یا «ترجمه متن‌هایی که داخل عکس قرار دارند.»

البته این موضوع را به‌طور کوتاه در بخش سوم هم توضیح داده بودیم، اما چون اهمیت زیادی دارد، تصمیم گرفتیم در این قسمت به‌صورت جداگانه و کامل آن را آموزش بدهیم.

ترجمه آنلاین عکس به چه معنا است؟

«ترجمه آنلاین عکس» که به آن «ترجمه تصویر» هم گفته می‌شود، به این معنا است که شما بتوانید متن‌های نوشته‌شده داخل یک تصویر را به زبان دیگری ترجمه کنید.

گاهی اوقات یک عکس، کارت ویزیت پوستر، اسکرین‌شات یا حتی یک صفحه اسکن‌شده در اختیار داریم که روی آن متنی به زبانی ناآشنا نوشته شده است. در چنین شرایطی، ترجمه آنلاین عکس این امکان را می‌دهد که متن موجود در تصویر شناسایی شود و به زبان دل‌خواه شما برگردانده شود.

چرا ترجمه متن داخل عکس با متن تایپ‌شده فرق دارد؟

وقتی متنی را تایپ می‌کنید یا فایل Word آن را در دسترس دارید، نرم‌افزارها و ابزارهای ترجمه به‌راحتی می‌توانند کلمات را شناسایی و ترجمه کنند. اما متنی که داخل یک عکس چاپ شده است، برای کامپیوتر فقط بخشی از تصویر است، نه نوشته‌ای قابل‌تشخیص.

به همین دلیل اگر یک جمله روی پوستر یا اسکرین‌شات نوشته شده باشد، ابزارهای عادی ترجمه آن را نمی‌بینند و نمی‌توانند مستقیماً ترجمه کنند. در چنین مواقعی لازم است ابتدا با کمک فناوری «تشخیص متن» (OCR) حروف و کلمات موجود در تصویر شناسایی شوند. بعد از این مرحله، متن به‌صورت قابل‌خواندن در می‌آید و می‌توان آن را مانند هر متن تایپ‌شده دیگری ترجمه کرد.

به بیان ساده، ترجمه متن داخل عکس ترکیبی از دو بخش است:

  1. تشخیص متن داخل تصویر
  2. ترجمه متن شناسایی‌شده

مثال ساده از ترجمه تصویر

فرض کنید یک منوی رستوران به زبان انگلیسی در اختیار دارید و می‌خواهید معنای آن را متوجه شوید. به‌جای اینکه تک‌تک کلمات را تایپ کنید یا از دیکشنری دستی بیرون آورید، کافی است یک عکس از منو بگیرید و آن را در یک هوش مصنوعی ترجمه آنلاین عکس بارگذاری کنید. 

هوش، متن را استخراج‌ کرده و به زبان فارسی ترجمه می‌کند. سپس متن ترجمه‌شده را روی عکس قرار می‌دهد و شما می‌توانید کل منو را به‌راحتی بخوانید و از آن استفاده کنید. 

در عکس زیر نمونه‌ای از ترجمه یک منوی ترکی به انگلیسی را می‌بینید. هوش مصنوعی که در این ترجمه به کار رفته است، گوگل ترنسلیت است که در ادامه درباره آن صحبت خواهیم کرد.

نقش هوش مصنوعی در ترجمه آنلاین عکس

هوش مصنوعی در ترجمه آنلاین عکس دو وظیفه اصلی را به‌ترتیب انجام می‌دهد. ابتدا با کمک فناوری تشخیص متن (OCR) محتوای نوشتاری موجود در تصویر را شناسایی کرده و آن را از حالت تصویری به متن قابل‌ ویرایش تبدیل می‌سازد. در این مرحله، کلمات و جملات دیگر بخشی از تصویر نیستند، بلکه مانند یک متن تایپ‌شده جدا و آماده استفاده می‌شوند. 

پس از آن، هوش مصنوعی وارد مرحله دوم می‌شود و متن استخراج‌شده را به زبان مورد نظر کاربر ترجمه می‌کند. به این ترتیب، فرایند ترجمه عکس به‌شکلی یکپارچه انجام می‌شود: هم متن از تصویر جدا می‌گردد و هم ترجمه‌ای روان و قابل‌استفاده در اختیار قرار می‌گیرد.

کدام هوش مصنوعی‌ها ترجمه آنلاین عکس را انجام می‌دهند؟

امروزه ابزارها و سرویس‌های مختلفی وجود دارند که با استفاده از هوش مصنوعی می‌توانند متن داخل عکس را تشخیص داده و سپس آن را ترجمه کنند. برخی از معروف‌ترین نمونه‌ها شامل موارد زیر هستند:

  • Google Translate: یکی از پرکاربردترین ابزارهاست که با گرفتن عکس یا آپلود تصویر، متن داخل آن را شناسایی و سریع ترجمه می‌کند.
  • ChatGPT: علاوه‌بر کاربردهای دیگر متن داخل عکس را هم استخراج کرده و ترجمه می‌کند. 
  • Microsoft Translator: اپلیکیشنی کاربردی که امکان تشخیص متن از تصویر و ارائه ترجمه روان به چندین زبان را دارد.
  • Yandex Translate: ابزاری آنلاین با پشتیبانی از زبان‌های متعدد که قابلیت استخراج و ترجمه متن‌های تصویری را فراهم می‌کند.
  • ترجمیفای: یک نرم‌افزار هوش مصنوعی ساخته‌شده در داخل که به‌خوبی متن‌های فارسی را از عکس جدا کرده و آن‌ها را ترجمه می‌کند. 

آموزش گام‌به‌گام ترجمه آنلاین عکس

همان‌طور که پیش‌تر اشاره شد، ابزارهای مختلفی با استفاده از هوش مصنوعی وجود دارند که امکان ترجمه متن داخل تصاویر را فراهم می‌کنند. یکی از پرکاربردترین و شناخته‌شده‌ترین این ابزارها Google Translateاست. در ادامه، نحوه ترجمه آنلاین عکس را با استفاده از این ابزار به صورت گام‌به‌گام آموزش می‌دهیم:

گام اول؛ انتخاب تصویر

 ابتدا عکسی که حاوی متن مورد نظر شماست، آماده کنید. این تصویر می‌تواند عکس منو، پوستر، اسکرین‌شات یا هر متن تصویری دیگری باشد.

گام دوم؛ باز کردن Google Translate

به اپلیکیشن موبایل Google Translate یا نسخه وب گوگل ترنسلیت مراجعه کنید و آن را باز کنید. سپس در نسخه کامپیوتر، گزینه عکس Image)) را انتخاب کنید. این گزینه در نسخه وب، در شکل زیر نشان داده شده است:

در نسخه موبایل لازم نیست در این مرحله کاری انجام دهید. 

گام سوم؛ انتخاب صحیح زبان مبدا و مقصد

قبل از بارگذاری تصویر، مطمئن شوید که زبان متن اصلی (زبان مبدا) و زبان ترجمه (زبان مقصد) به‌درستی انتخاب شده‌اند. 

در نسخه وب:

زبان مبدا (From): در قسمت بالای صفحه، در سمت چپ، یک فلش کوچک به‌سمت پایین وجود دارد (دایره سبز در عکس زیر). برای انتخاب زبان مبدا، روی آن کلیک کرده و زبان مورد نظر را انتخاب کنید. اگر مطمئن نیستید که متن به کدام زبان است، می‌توانید گزینه “Detect language” را انتخاب کنید تا Google Translate زبان را به‌طور خودکار تشخیص دهد.

زبان مقصد (To): در بالای پنجره سمت راست، که مربوط به بخش زبان مقصد است، باز هم یک فلش کوچک به‌سمت پایین وجود دارد (دایره آبی در عکس زیر) روی آن کلیک کرده و زبان مقصد (برای مثال فارسی) را انتخاب کنید.

در اپلیکیشن موبایل:

در صفحه اصلی اپلیکیشن، در پایین صفحه، هم زبان مبدا و هم زبان مقصد مشخص شده و با یک فلش به هم وصل شده‌اند. کافی است روی هرکدام از آن‌ها کلیک کرده و زبان مورد نظر را مطابق تصویر زیر انتخاب کنید. 

گام چهارم؛ بارگذاری عکس

گزینه Camera(در گوشی) یا Browse your file (در کامپیوتر) را انتخاب کرده و تصویر مورد نظر را بارگذاری کنید.

گزینه Camera در گوشی:

گزینه Browse your file در کامپیوتر:

نکته: وقتی گزینه Camera را در گوشی می‌زنید، دوربین گوشی باز می‌شود. اگر عکس را به‌شکل فیزیکی در دست دارید (مثل کارت ویزیت) آن را مقابل دوربین بگیرید. اما اگر عکس مورد نظر شما در حافظه گوشی قرار دارد، گالری را (که در همان صفحه باز‌شده مشخص است)، باز کنید و عکس مورد نظر را آپلود نمایید. 

گام پنجم؛ تشخیص متن توسط هوش مصنوعی

Google Translate با کمک فناوری OCR متن داخل تصویر را شناسایی می‌کند و آن را به‌شکلی قابل‌ ویرایش استخراج می‌نماید. سپس متن استخراج‌شده را به زبان مقصد ترجمه کرده و نشان می‌دهد. شما می‌توانید این متن را بخوانید، کپی کنید یا در صورت نیاز ویرایش کنید.

ترجمه آنلاین عکس چه کاربردهایی دارد؟

روش ترجمه آنلاین عکس به افراد کمک می‌کند تا متن‌های نوشته‌شده به زبان‌های دیگر را بدون نیاز به تایپ‌کردن، سریع و راحت بفهمند. برخی کاربردهای مهم آن در زندگی روزمره عبارتند از:

ترجمه منوهای رستوران و کافه‌ها

وقتی به یک رستوران خارجی می‌روید و منوی آن به زبانی غیر از فارسی است، می‌توانید با گرفتن عکس از منو و استفاده از ترجمه آنلاین، تمامی آیتم‌ها را به زبان خودتان ببینید و راحت سفارش دهید.

مطالعه پوسترها و تابلوها

پوسترهای تبلیغاتی، اطلاعیه‌ها یا تابلوهای شهری به زبان خارجی را می‌توان با ترجمه عکس خواند و متوجه پیام آن‌ها شد، بدون اینکه لازم باشد تک‌تک کلمات تایپ شود.

خواندن کتاب و مجلات اسکن‌شده

اگر نسخه‌ای اسکن‌شده از یک کتاب یا مجله خارجی دارید، ترجمه آنلاین عکس کمک می‌کند متن داخل تصاویر شناسایی و به زبان مورد نظر شما ترجمه شود.

ترجمه اسکرین‌شات‌ها و پیام‌ها

گاهی پیام‌ها، اسکرین‌شات‌ها یا صفحات وب به زبان دیگری هستند. با ترجمه عکس، می‌توان سریع متن را دیده و متوجه محتوای آن شد.

یادگیری زبان‌های جدید

ترجمه تصاویر به زبان فارسی یا دیگر زبان‌ها می‌تواند به مبتدی‌ها در یادگیری لغات و جملات زبان جدید کمک کند و تجربه‌ای تعاملی و کاربردی ایجاد کند.

ترجمه دفترچه راهنما

بسیاری از وسایل خانگی مانند ماشین لباس‌شویی، یخچال و…. دارای دفترچه راهنما به زبان انگلیسی هستند. با استفاده از گوگل ترانسلیت، به‌راحتی می‌توانید عکس گرفته‌شده از دفترچه را به زبان فارسی ترجمه کنید. همچنین می‌توانید پس از کلیک روی آیکون دوربین، در تلفن همراه، متن را روبه‌روی دوربین گرفته و ترجمه آن را ببینید. 

خلاصه مقاله

ترجمه آنلاین عکس یعنی شناسایی متن داخل تصاویر و تبدیل آن به زبان دل‌خواه. متن داخل عکس با متن تایپ‌شده فرق دارد و برای ترجمه نیازمند فناوری OCR است تا ابتدا متن استخراج شود و سپس ترجمه گردد. ابزارهای پرکاربرد برای این کار شامل Google Translate، ChatGPT، Microsoft Translator، Yandex Translate و ترجمیفای هستند. روند کار معمولاً شامل انتخاب تصویر، تعیین زبان مبدا و مقصد، بارگذاری عکس، تشخیص متن و ترجمه آن است. کاربردها شامل ترجمه منوها، پوسترها، اسکرین‌شات‌ها، کتاب‌ها و دفترچه راهنما است و به مبتدی‌ها در یادگیری زبان و درک سریع محتوا کمک می‌کند.

اسکرول به بالا