Новейшая модель искусственного интеллекта o1 от OpenAI

21 сентября 2024

OpenAI только что нажал на кнопку «турбо», выпустив свое новое семейство моделей искусственного интеллекта под названием 01 Preview и 01 Mini.

Это не просто обновление. Эти ребята могут решать любые задачи, от физики до кодирования, обладая мозгом уровня доктора философии.

Мы говорим о решении математических задач, от которых даже самые умные люди могут вспотеть. Забудьте о том, на что, по вашему мнению, способен ИИ: эти модели не просто расширяют границы, они разбивают их кувалдой.

Они здесь не для того, чтобы играть по правилам и быть вежливыми, они переписывают все правила игры. Представьте, что ваши старые модели GPT играют в шашки в парке, в то время как модели 01 где-то вдалеке делают шахматные ходы в 4D на турнире в невесомости.

Уже заинтригованы?

Новое семейство моделей o1

Когда OpenAI выпустил семейство 01, это был не ребрендинг старых технологий; о нет, эти модели созданы для гораздо более грандиозных задач, о которых GPT-4 мог только мечтать, например, для получения степени доктора философии в исследованиях «Я-умнее-тебя».

Будь то сложные уравнения физики или умопомрачительные математические задачи, 01 Preview был протестирован для выполнения заданий на уровне доктора философии в некоторых из самых мозговыносящих академических областей.

Насколько это впечатляюще?

Например, в одном из тестов 01 Preview решил 83% задач из Международной математической олимпиады.

GPT-4? Всего лишь 13 %. Это все равно что сравнивать школьника, с трудом осваивающего алгебру, с профессором, потягивающим чашку кофе и ухмыляющимся.

Конечно, это маркетинговый ход для «ИИ уровня доктора философии», но на этот раз он основан на реальных, холодных, жестких данных.

OpenAI не шутили, когда говорили, что эта штука глубоко мыслит.

01 Preview может выполнять задания, связанные с решением реальных проблем: сложные, многоступенчатые рассуждения – не из разряда «выдавать резюме из Википедии».

Мастерство рабочего процесса и кодирования

Теперь давайте поговорим о кодировании, потому что именно здесь эти модели действительно великолепны. По данным OpenAI, и 01 Preview, и 01 Mini творят чудеса в решении задач программирования и отладки сложного кода.

Независимо от того, опытный ли вы разработчик или тот, кто 40 раз в день набирает в Гугле «как исправить эту ошибку», модели могут ускорить рабочий процесс и избавить вас от необходимости терять часы, бьясь головой о клавиатуру.

В международных соревнованиях по кодингу, таких как Codeforces, 01 Preview занимает в среднем 89-й уровень. То есть, можно сказать, что он обучает 89% программистов-людей.

Таким образом, если у вас есть проект, требующий множества этапов, таких как написание, отладка и доработка кода, эта модель может сэкономить безумное количество времени в вашем рабочем процессе.

Конечно, он на 80% дешевле, но он по-прежнему способен решать 70% математических задач IMO, уступая лишь своему более крупному собрату.

Ограничения

Прежде чем все мы здесь начнем поклоняться алтарю OpenAI, давайте отметим, что модели 01 не идеальны.

Пока что они хороши для выполнения текстовых задач – никаких генераций изображений, просмотра Интернета и загрузки файлов. Иными словами, если вы хотели использовать 01 Preview для создания следующего большого мема или просеивания всех видеороликов с кошками, появившихся на этой неделе, вам не повезло.

Есть еще одна плохая новость: ограничения на использование.

Пользователи ChatGPT Plus имеют ограничение на 30 сообщений в неделю с 01 Preview и 50 сообщений в неделю с 01 Mini.

Так что если вы находитесь на середине разработки какого-то крупного проекта, вы можете смотреть на этот лимит сообщений, как ребенок, который слишком часто видит окончание игры.

Безопасность и защита (строже, чем когда-либо)

С другой стороны, компания OpenAI добилась больших успехов в обеспечении безопасности этих моделей. В одном из своих тестов на взлом - где ИИ обманом заставляют генерировать небезопасный контент - 01 Preview набрал впечатляющие 84 балла из 100, по сравнению с позорными 22 баллами GPT-4.

Это огромный шаг в сторону повышения безопасности ИИ, и очевидно, что OpenAI относится к этому со всей серьезностью.

Что дальше для 01

Пока это только текстовая функциональность, но OpenAI планирует добавить такие функции, как просмотр веб-страниц, создание изображений и загрузка файлов. Когда это произойдет, мы увидим, как модели 01 появятся в еще большем количестве областей - например, создание контента, дизайн и исследования в режиме реального времени.

В заключение хочется сказать, что это будущее, но оно еще не наступило. Семейство моделей AI 01 - это впечатляющий скачок вперед, но мы все еще находимся в самом начале пути. Хотя эти модели способны справляться с узкоспециализированными задачами, для повседневных дел они не подходят.

По этой причине GPT-4 кажется непревзойденным чемпионом в большинстве этих задач общего назначения.

Но если OpenAI наконец-то выполнит то, что обещал - просмотр веб-страниц, создание изображений и многое другое - нас ждет будущее, в котором ИИ будет не просто инструментом, а полноценным партнером в исследованиях.

Но пока что мы можем только стоять в стороне и наблюдать за тем, как эти модели расширяют границы возможностей ИИ.

#OpenAI

#ChatGPT