Новая модель OpenAI с возможностью самостоятельного дообучения

💻 Новейшую модель OpenAI o1 можно будет дообучать самостоятельно

OpenAI представил новый метод дообучения моделей o1 и o1-mini под названием reinforcement fine-tuning («дообучение с подкреплением»). С помощью RFT из o1 можно будет обучить эксперта в узкой области, показав ему всего несколько десятков примеров.

🧬Работу этой технологии продемонстрировал биоинформатик Джастин Риз и Университет Беркли на примере выявления генов, ответственных за определенные заболевания. o1-mini была обучена на датасете с данными о симптомах пациентов и соответствующих им генах, вызывающих патологии.

o1-mini после дообучения значительно превзошла оригинальную модель o1 в предсказании неисправных генов по симптомам.

Успехом технологии является тот факт, что после дообучения модели научились компетентно связывать симптомы и генные патологии, а не просто запоминать их соответствие.

Этот метод может применяться для создания экспертных моделей в различных профессиональных областях, таких как экономика, право, медицина и другие.

📆 Сейчас reinforcement fine-tuning находится на стадии бета-тестирования, и доступ для пользователей будет открыт в начале 2025 года.

Это лишь один из 12 «новогодних подарков» от OpenAI. Следите за обновлениями.

👋 Подпишитесь на Hi, AI!

Источник: @hiaimedia