Вчора OpenAI випустив GPT-4 , який є наступною ітерацією моделі ШІ, на основі якої було побудовано ChatGPT.
Згідно з анонсом OpenAi: "Ми створили GPT-4, останню віху в зусиллях OpenAI щодо розширення глибинного навчання. GPT-4 — це велика мультимодальна модель (приймає вхідні зображення та текст, видає текстові виходи), яка, хоча й менш здатна, ніж люди в багатьох сценаріях реального світу, демонструє продуктивність на рівні людини на різних професійних і академічних тестах."
GPT-4 — це велика мультимодальна модель (приймає вхідні зображення та текст, видає текстові виходи), яка, хоча й менш здатна, ніж люди в багатьох сценаріях реального світу, демонструє продуктивність на рівні людини на різних професійних і академічних тестах.
OpenAI каже, що GPT-4 може досягти «продуктивності людського рівня» в ряді завдань: "Наприклад, він здає симуляцію адвокатського іспиту, набравши приблизно 10% найкращих учасників іспиту; навпаки, оцінка GPT-3.5 була близько нижніх 10%.
Ми витратили 6 місяців на ітераційне узгодження GPT-4, використовуючи уроки нашої змагальної програми тестування, а також ChatGPT, що призвело до наших найкращих результатів (хоча й далеких від ідеальних) щодо фактичності, керованості та відмови виходити за огорожі.
Протягом останніх двох років ми перебудували весь стек глибокого навчання та разом із Azure спільно з нуля розробили суперкомп’ютер для нашого робочого навантаження. Рік тому ми навчили GPT-3.5 як перший «тестовий запуск» системи.
Ми знайшли та виправили деякі помилки та вдосконалили наші теоретичні основи. У результаті наш тренувальний запуск GPT-4 був (принаймні для нас!) безпрецедентно стабільним, ставши нашою першою великою моделлю, продуктивність тренування якої ми змогли точно передбачити заздалегідь.
Оскільки ми продовжуємо зосереджуватися на надійному масштабуванні, ми прагнемо вдосконалити нашу методологію, щоб допомогти нам передбачити майбутні можливості та підготуватися до них набагато заздалегідь — те, що ми вважаємо критичним для безпеки."
OpenAI повідомляє про початок широкої інтеграції оновлення: "Ми випускаємо можливість введення тексту GPT-4 через ChatGPT і API (зі списком очікування). Щоб підготувати можливість введення зображень для більшої доступності, ми тісно співпрацюємо з одним партнером.
Ми також відкриваємо OpenAI Evals, нашу структуру для автоматизованої оцінки продуктивності моделі штучного інтелекту, щоб дозволити будь-кому повідомляти про недоліки в наших моделях і допомагати спрямовувати подальші вдосконалення."
У звичайній розмові різниця між GPT-3.5 і GPT-4 може бути незначною.
Різниця проявляється, коли складність завдання досягає достатнього порогу — GPT-4 надійніший, креативніший і здатний обробляти набагато більш нюансовані інструкції, ніж GPT-3.5.
Щоб зрозуміти різницю між цими двома моделями, розробники провели тестування за допомогою різноманітних контрольних тестів, зокрема симуляції іспитів, які спочатку були розроблені для людей. Вони продовжили, скориставшись найновішими загальнодоступними тестами (у випадку олімпіад і питань з безкоштовними відповідями AP) або придбавши видання практичних іспитів 2022–2023 років.
Компанія OpenAI не проводила спеціальної підготовки до цих іспитів. Меншість проблем під час іспитів була помічена моделлю під час навчання, але вони вважаємо, що результати репрезентативні — ви можете проглянути їхній технічний звіт, щоб дізнатися більше.
Джерело: openai.com
GPT-4 також оцінили за традиційними тестами, розробленими для моделей машинного навчання. GPT-4 значно перевершує існуючі великі мовні моделі, поряд із більшістю найсучасніших моделей (SOTA), які можуть включати спеціальне тестування або додаткові протоколи навчання:
Джерело: openai.com
Багато існуючих тестів машинного навчання написані англійською мовою. Щоб отримати початкове уявлення про можливості іншими мовами, OpenAI переклали тест MMLU — набір із 14 000 завдань із множинним вибором, що охоплює 57 тем — різними мовами за допомогою Azure Translate (див. Додаток).
У 24 із 26 протестованих мов GPT-4 перевершує англійську продуктивність GPT-3.5 та інших LLM (Chinchilla, PaLM), зокрема для мов із низьким ресурсом, таких як латиська, валлійська та суахілі:
Джерело: openai.com
OpenAi зараз використовують GPT-4 для внутрішнього використання, що значно впливає на такі функції, як підтримка, продажі, модерація контенту та програмування. Вони також використовують його, щоб допомогти людям оцінювати результати штучного інтелекту, починаючи другий етап стратегії узгодження.
GPT-4 може приймати підказки тексту та зображень, що — паралельно з налаштуванням лише тексту — дозволяє користувачеві вказати будь-яке бачення чи мовне завдання.
Зокрема, він генерує текстові виходи (природна мова, код тощо) на основі вхідних даних, що складаються з вкрапленого тексту та зображень.
У ряді доменів, включно з документами з текстом і фотографіями, діаграмами або знімками екрана, GPT-4 демонструє такі ж можливості, як і при введенні лише тексту.
Крім того, його можна доповнити техніками тестового часу, які були розроблені для мовних моделей лише з текстом, включно з підказками кількох дій і ланцюжком думок.
Вхідні зображення все ще є попереднім переглядом дослідження та не є загальнодоступними.
Джерело: OpenAi