
TikTok тепер вимагає позначати контент, опублікований для просування
18 Липня, 2023 18:24
Нові тренди Тікток, які варто спробувати цього тижня
19 Липня, 2023 15:39
TikTok тепер вимагає позначати контент, опублікований для просування
18 Липня, 2023 18:24
Нові тренди Тікток, які варто спробувати цього тижня
19 Липня, 2023 15:39Meta запускає власну модель штучного інтелекту, Llama 2, призначену для роботи, яку виконують такі програми, як ChatGPT OpenAI, Google Bard, Bing Chat та інших сучасних чатботів.
На основі сукупності загальнодоступних даних Meta стверджує, що продуктивність Llama 2 значно покращилася порівняно з попереднім поколінням моделей Llama.
Llama 2 є продовженням Llama — набору моделей, які можуть генерувати текст і код у відповідь на підказки, порівнянно з іншими системами, подібними до чатботів.
Попередня версія Llama була доступна лише за запитом, Мета закрила доступ до її моделей через побоювання неправомірного використання.
І ось наступний крок Meta, яка розкриває нове покоління свого штучного інтелекту Llama 2 для всіх — і робить її використання безкоштовним для досліджень і комерційного використання.
Що вміє штучний інтелект LLama 2 від Meta
За даними Meta, LLama 2 було навчено на 40% більше даних порівняно з LLama 1, яка включає інформацію з «загальнодоступних джерел даних в Інтернеті».
Він також каже, що він «перевершує» інші LLM, такі як Falcon і MPT, коли справа доходить до аргументації, кодування, кваліфікації та тестів знань.
Відкриваючи LLama, Meta заявила, що хоче покращити безпеку та прозорість. Компанія заявила, що модель LLama 2 була «об’єднана» або протестована на безпеку шляхом «генерування суперечливих підказок для полегшення тонкого налаштування моделі» як всередині, так і ззовні. Meta також розкриває, як моделі оцінюються та налаштовуються.
LLama 2 з відкритим вихідним кодом буде доступна через платформу Microsoft Azure. Meta сказав, що LLama також буде доступна через AWS, Hugging Face та інших постачальників.
Ключові риси новинки від Мета
- Llama 2 доступний у двох версіях: Llama 2 і Llama 2-Chat, останню з яких було налаштовано для двосторонніх розмов.
- Llama 2 і Llama 2-Chat далі поділяються на версії різної складності: 7 мільярдів параметрів, 13 мільярдів параметрів і 70 мільярдів параметрів. («Параметри» — це частини моделі, отримані з навчальних даних і, по суті, визначають навички моделі щодо проблеми, у цьому випадку генерування тексту.)
- Llama 2 був навчений на двох мільйонах токенів, де «токени» представляють необроблений текст, наприклад «fan», «tas» і «tic» для слова «fantastic». Це майже вдвічі більше, ніж було навчено Llama (1,4 трильйона), і, загалом, чим більше токенів, тим краще, коли йдеться про генеративний ШІ. Поточна флагманська велика мовна модель (LLM) Google, PaLM 2, як повідомляється, була навчена на 3,6 мільйонах токенів, і є припущення, що GPT-4 також навчено на трильйонах токенів.
- Meta не розкриває конкретні джерела навчальних даних у технічному документі, за винятком того, що це з Інтернету, переважно англійською мовою, а не з власних продуктів або послуг компанії, і підкреслює текст «фактичного» характеру.
Цікаво, але зараз Meta каже, що в ряді тестів моделі Llama 2 працюють трохи гірше, ніж найвідоміші конкуренти із закритим кодом, GPT-4 і PaLM 2, причому Llama 2 значно відстає від GPT-4 у комп’ютерному програмуванні. Але оцінювачі вважають Llama 2 приблизно такою ж «корисною», як ChatGPT, стверджує Meta; Llama 2 відповіла однаково на набір із приблизно 4000 підказок, призначених для перевірки «корисності» та «безпеки».
Як отримати доступ до новинки
Доступ пропонується після надсилання запиту на сайті компанії.




