OpenAI выпускает o1 – свою первую модель способную "рассуждать"
Модель o1 – это первая из серии "рассуждающих" моделей OpenAI. o1 лучше справляется с кодированием и математическими задачами, чем предыдущие модели, но она медленнее и дороже.
Параллельно с o1 компания выпускает модель o1-mini – более компактную и дешевую. С практической точки зрения, новая модель лучше предыдущих справляется с написанием кода и решением многоэтапных задач. Но модель o1 дороже и медленнее, чем GPT-4o. OpenAI называет этот релиз o1 "предварительной версией", чтобы подчеркнуть, что модель находится в стадии разработки.
Пользователи ChatGPT Plus и Team уже получили доступ к o1-preview и o1-mini. OpenAI планирует предоставить доступ к o1-mini всем бесплатным пользователям ChatGPT, но не уточняет, когда это произойдет. Доступ разработчиков к o1 очень дорог. Доступ для API к o1-preview стоит 15 долларов за 1 миллион токенов (входных лексем) и 60 долларов за 1 миллион выходных лексем. Для сравнения, GPT-4o стоит 5 долларов за 1 миллион токенов и 15 долларов за 1 миллион выходных лексем. То есть в 3-4 раза дороже.
По словам руководителя исследований OpenAI Джерри Туорека, o1 "была обучена с помощью совершенно нового алгоритма оптимизации и нового набора данных, специально разработанного для нее". Модель o1 использует "цепочку рассуждений" для обработки запросов, подобно тому, как человек решает задачи методом step-by-step. В результате применения новой методики обучения, по мнению OpenAI, модель стала более точной. "Но мы не можем сказать, что решили проблему галлюцинаций", – говорит ученый.
"Модель определенно лучше решает стандартный тест по математике, чем я, а я был математиком в колледже", – говорит главный научный сотрудник OpenAI Боб Макгрю. По его словам, OpenAI протестировала o1 на задачах отборочного тура Международной математической олимпиады. Если GPT-4o правильно решила только 13% задач, то o1 – 83%.
В то же время во многих областях o1 не так хороша, как GPT-4o. Ей пока не хватает фактических знаний о мире. У модели нет возможности просматривать веб-страницы или обрабатывать файлы и изображения.
Неожиданное впечатление возникает, когда o1 начинает решать достаточно трудную многошаговую задачу. Модель постоянно вставляет разного рода реплики, которые имитируют процесс мышления человека. Она говорит "Это любопытно", "Я обдумываю…", "Хорошо, давайте посмотрим…", "Я могу сделать то или это, с чего мне начать?"
OpenAI стремится привлечь новое финансирования при оценке компании в 150 миллиардов долларов, пишет Bloomberg. Цель компании – создание автономных агентов, которые способны принимать решения и совершать действия от вашего имени. По мнению разработчиков, модель o1 – это шаг в нужном направлении.