«Распознавание рукописного текста: история, перспективы, текущие проекты». Онлайн-лекция научного сотрудника Лаборатории медиевистических исследований НИУ ВШЭ
События

17 мая в 18:10 (время московское) в Греко-латинском клубе Высшей школы экономики Antibarbari состоится встреча со Светланой Яцык, кандидатом исторических наук, научным сотрудником Лаборатории медиевистических исследований НИУ ВШЭ.

За последние несколько лет развитие технологий распознавания рукописного текста (Handwritten Text Recognition, HTR) сделало автоматизированную транскрипцию древних документов доступной для широкого круга учёных. Существующее программное обеспечение позволяет безболезненно развёртывать конвейеры HTR, а данные для обучения моделей (ground truth) становятся всё более доступными, что даёт учёным возможность быстро получать транскрипции в объёмах, на которые ранее потребовались бы годы интенсивной работы.

На предстоящей встрече Светлана Яцык расскажет о существующих методах автоматической транскрипции, о готовых инструментах (Tesseract, Transkribus, kraken / eScriptorium) и проектах, в которых они используются.

В частности, на примере платформы eScriptorium Светлана покажет, как готовить данные для тренировки; обучать модели и делать их тонкую настройку (fine-tuning); оценивать качество транскрипции; использовать «грязную», неотредактированную транскрипцию для решения дальнейших исследовательских задач. 

Встреча пройдёт на платформе Zoom по ссылке: https://us02web.zoom.us/j/84892760189?pwd=b3MzUmVScjd2U2orZEUrVFU1Y3dkUT09.

 

Источник: Греко-латинский клуб Antibarbari Высшей школы экономики


Другие публикации на портале:

Еще 9