
ByteDance запускає додаток для створення відео за допомогою AI
7 Серпня, 2024 16:55
Instagram розширює кількість слайдів у каруселях до 20
9 Серпня, 2024 16:16
ByteDance запускає додаток для створення відео за допомогою AI
7 Серпня, 2024 16:55
Instagram розширює кількість слайдів у каруселях до 20
9 Серпня, 2024 16:16OpenAI заявляє, що остання модель GPT-4o має «середній» ризик.
OpenAI оприлюднила документ під назвою «System Card GPT-4o», який описує заходи безпеки та оцінки ризиків, проведені стартапом перед випуском останньої моделі.
Оцінка ризиків GPT-4o: основні результати
GPT-4o було запущено у травні цього року. Перед його дебютом OpenAI залучила зовнішню групу «червоних команд» або експертів з безпеки, які намагалися знайти слабкі місця в системі (що є досить поширеною практикою). Вони вивчали такі ризики, як можливість того, що GPT-4o створюватиме несанкціоновані клони чийогось голосу, еротичний і насильницький контент або уривки захищеного авторським правом аудіо. Тепер результати цих перевірок опубліковані.
Середній ризик GPT-4o: як оцінювалася безпека
За власною оцінкою OpenAI, дослідники виявили, що GPT-4o є моделлю середнього ризику. Загальний рівень ризику було визначено з найвищої оцінки ризику серед чотирьох категорій: кібербезпека, біологічні загрози, вплив на думки та автономність моделі. Усі ці категорії були визнані низькоризиковими, за винятком впливу на думки, де дослідники виявили, що деякі приклади текстів, створених GPT-4o, можуть бути більш переконливими для читачів, ніж тексти, написані людьми — хоча загалом модель не була більш переконливою.
Реакція OpenAI на критику стандартів безпеки
Речниця OpenAI, Ліндсей МакКаллум Ремі, повідомила The Verge, що системна картка включає оцінки готовності, створені внутрішньою командою, а також зовнішніми тестувальниками, які зазначені на вебсайті OpenAI як Model Evaluation and Threat Research (METR) та Apollo Research, які розробляють оцінки для AI-систем.
Випуск системної картки GPT-4o в контексті політичного тиску
Це не перша система карток, випущена OpenAI; GPT-4, GPT-4 з підтримкою візуальних даних і DALL-E 3 також пройшли подібне тестування, і дослідження було опубліковане. Але OpenAI випускає цю систему карток у вирішальний момент.
Компанія зазнає постійної критики щодо своїх стандартів безпеки, від своїх співробітників до державних сенаторів.
Лише за кілька хвилин до випуску системної картки GPT-4o, The Verge ексклюзивно повідомила про відкритий лист сенаторки Елізабет Воррен (демократ від Массачусетсу) та конгресвумен Лорі Трахан (демократ від Массачусетсу), який закликає до відповідей щодо того, як OpenAI поводиться зі своїми викривачами та перевірками безпеки.
У цьому листі описуються численні проблеми з безпекою, які були публічно висловлені, включаючи коротке звільнення генерального директора OpenAI Сема Альтмана у 2023 році через занепокоєння ради директорів та відхід одного з керівників з безпеки, який заявив, що «культура безпеки та процеси відійшли на другий план порівняно з новими продуктами».
Виклики перед GPT-4o на тлі майбутніх виборів
Крім того, компанія випускає дуже потужну мультимодальну модель напередодні президентських виборів у США. Існує очевидний потенційний ризик того, що модель випадково поширюватиме дезінформацію або буде захоплена зловмисниками — навіть якщо OpenAI намагається підкреслити, що компанія тестує сценарії реального світу, щоб запобігти зловживанням.
Заклики до прозорості та регулювання AI
Було багато закликів до OpenAI бути більш прозорими, не лише щодо навчальних даних моделі (чи була вона навчена на YouTube?), але й щодо тестування безпеки.
У Каліфорнії, де базується OpenAI та багато інших провідних AI-лабораторій, сенатор штату Скотт Вайнер працює над законопроєктом щодо регулювання великих мовних моделей, включаючи обмеження, які притягатимуть компанії до юридичної відповідальності, якщо їхні AI-системи будуть використані в шкідливих цілях.
Якщо цей закон буде ухвалено, граничні моделі OpenAI доведеться відповідати державним оцінкам ризиків перед тим, як вони стануть доступними для публічного використання.
Але основний висновок з системної картки GPT-4o полягає в тому, що, незважаючи на залучення зовнішніх «червоних команд» і тестувальників, значна частина відповідальності лежить на OpenAI за власну оцінку.
Деталі системної картки GPT-4o на офіційному сайті OpenAI
На офіційному сайті OpenAI доступний розділ з деталями системної картки GPT-4o. У ньому містяться розширені дані щодо проведених оцінок, залучених експертів та основних висновків, зроблених під час тестування моделі. Документ також включає висновки зовнішніх червоних команд і методології, які були використані для оцінки безпеки та ризиків.
Повний текст системної картки GPT-4o можна знайти на офіційному сайті OpenAI за цим посиланням.





