Яндекс научился читать текст на картинках

Основной язык сайта, опубликовано 26 марта 2015 г.

Компания «Яндекс» в своем официальном блоге на днях рассказала о своем последнем достижении в области организации поиска. Российская ИТ-компания презентовала поиск по тексту на изображениях, размещенных не просто в Интернете, а в облачном хранилище.

Яндекс поиск текста в картинках

В Яндекс.Диске появилась возможность искать изображения форматов JPEG, GIF и PNG, содержащие текст поискового запроса. Достаточно ввести в поисковую строку нужное слово, и система найдёт на Диске картинки, на которых оно встретится. В результатах поиска пользователи также увидят файлы и папки, в названиях и описаниях которых есть это слово, и документы, в тексте которых оно содержится. Это очень удобная и нужная на практике функция. К примеру, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст.

Система состоит из двух частей — классификатора картинок и модуля распознавания. Сначала классификатор, глубокая нейронная сеть, отбирает из всех картинок те, на которых изображён текст. Он учится отличать их от прочих на огромной базе изображений. Затем модуль распознавания разбивает линии текста на отдельные символы. Конечно, точность распознавания текста зависит от типа изображения, его чёткости, фона, на котором находится текст, и многих других факторов. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями — 63,2%, а для скриншотов приближается к 100%.Помимо русского языка, система также распознает английский, украинский и турецкий.