YandexGPT научат переводить текст с изображений и видео

«Яндекс» обучит свою нейросеть YandexGPT распознавать и переводить тексты с изображений, аудио- и видеоматериалов. Компания планирует нанять около десяти AI-тренеров для этой работы.

Специалисты должны владеть английским языком и иметь навыки перевода, необходимые для обучения больших языковых моделей. Тренеры будут обучать генеративную модель, создавать собственные эталонные примеры, оценивать качество перевода и учить нейросеть распознавать и переводить тексты с изображений и видео.

По словам представителя «Яндекса», речь идёт о специализированных областях, таких как физика и юриспруденция.

Эксперты утверждают, что главная сложность заключается в необходимости собирать семантически близкие переводы, а не просто дословно переводить текст. В настоящее время нейросети часто используют дословный перевод.

«Яндекс» представил свою нейросеть YandexGPT в мае 2023 года. Летом прошлого года она научилась запоминать контекст беседы и задавать уточняющие вопросы. Затем её добавили в приложение для создания изображений «Шедеврум». В марте 2024 года компания представила третье поколение нейросетей YandexGPT, включая модель для бизнеса.