
Що таке Barbiecore? Все, що потрібно знати про вірусний тренд, натхненний Барбі
23 Квітня, 2023 13:44
Онлайн-магазин дитячих візочків Baby Dream, Анастасія Петровська: Війна змінює все, але ми стаємо сильніші
24 Квітня, 2023 07:00
Що таке Barbiecore? Все, що потрібно знати про вірусний тренд, натхненний Барбі
23 Квітня, 2023 13:44
Онлайн-магазин дитячих візочків Baby Dream, Анастасія Петровська: Війна змінює все, але ми стаємо сильніші
24 Квітня, 2023 07:00LinkedIn поділився новим технічним оглядом, як працює алгоритм визначення спам-контенту, і як контент набуває популярності в додатку.
Це допоможе вам зрозуміти фактори, які впливають на алгоритмічний потік LinkedIn, який, зрештою, визначає охоплення публікацій.
За словами LinkedIn: "Щоб забезпечити позитивну взаємодію з користувачами, коли публікується або поширюється контент, який суперечить нашій Політиці професійної спільноти LinkedIn, або коли повідомляється, що контент порушує ці політики, ми вживаємо заходів для видалення контенту.
Бувають рідкісні випадки, коли контент, завантажений на нашу платформу, залишається непоміченим нашими поточними механізмами захисту, що може призвести до поширення на платформі. Хоча такі інциденти трапляються нечасто, вони можуть мати згубні наслідки. Ось чому розробка моделей для виявлення контенту вірусного спаму надзвичайно важлива. Це надзвичайно складно, особливо коли виникають проблеми з дефіцитом даних вірусного контенту. Щоб зрозуміти, як вірусний спам-контент протікає через мережі учасників і виявляється, перш ніж він стане вірусним, необхідно бути в курсі останніх форм спам-контенту, що завантажується на платформу, і відповідно змінювати наші моделі. Розуміючи контент вірусності та спаму, ми змогли виконати комплексний аналіз функцій і сигналів, які були корисними для виявлення такого типу контенту, що дало нам змогу розв'язати ці проблеми."
Розуміння вірусності контенту
LinkedIn не створено для вірусності, але іноді публікації, які призводять до значного залучення у вигляді лайків, реакцій, коментарів і повторних публікацій за короткий проміжок часу, можуть вважатися вірусними.
Стратегії виявлення контенту вірусного спаму
Виявлення вірусного спаму — це більш масштабна робота, у рамках якої LinkediIn запустив кілька моделей штучного інтелекту на основі контенту та типу спаму, наявного на платформі.
Моделі штучного інтелекту, які використовуються для виявлення забороненого контенту, можна загалом класифікувати на дві основні категорії:
1) проактивний захист;
2) реактивний захист.
У проактивній моделі виявлення відбувається, щойно контент з’являється в каналі LinkedIn, тоді як у реактивній моделі інженери платформи відстежують дії, що відбуваються навколо опублікованого контенту, а потім намагаються передбачити його потенціал для широкого поширення.
Проактивний захист
На платформі проактивний захист діє, щоб передбачити потенційний вірусний спам-контент якомога раніше.
Ці засоби захисту складаються з двох типів класифікаторів. Перший набір класифікаторів тренується на певній категорії спаму, такій як мова ненависті; другий набір класифікаторів навчається на певному типі контенту, як-от відео чи статті.
Обидва типи класифікаторів були навчені різноманітним функціям, які забезпечують ранній сигнал як для вірусного вмісту, так і для спаму, про що йтиметься в наступному розділі.
Ці засоби захисту — це переважно глибокі нейронні мережі, які навчаються за допомогою Tensorflow і розгортаються за допомогою централізованої платформи ML на LinkedIn, Pro-ML.
Ці моделі запускаються на платформі кожні кілька годин і виконують відповідні дії, наприклад фільтрують або надсилають контент для перевірки вручну людиною.
Реактивний захист
Реактивний захист служить додатковим рівнем захисту до проактивного захисту та діє на контент після того, як він зібрав сигнали залучення, що вказують на вірусність.
Реактивні класифікатори запобігають тому, щоб контент спаму досягав великої кількості учасників і ставав надзвичайно вірусним.
Реактивна модель LinkedIn — це комбінація прогностичної моделі машинного навчання та евристики, яка використовує поведінку учасників, особливості контенту та моделі взаємодії з контентом, щоб передбачити ймовірність того, що вірусний контент є спамом.
Ці засоби захисту тренуються на моделі Boosted Trees і, подібно до проактивних засобів захисту, розгортаються за допомогою Pro-ML.
Конвеєр виявлення вірусного контенту
На діаграмі нижче показано процес виявлення контенту на платформі після його публікації.
Як тільки частина контенту з’являється на поверхні, існуючі класифікатори ML діють на основі безпосередніх ознак, які можна обчислити, наприклад, пов’язані з автором і контентом ознаки.
Якщо буде виявлено, що це спам чи порушення правил, LinkedIn або вживає автоматичних заходів, або надсилає його на перевірку спеціалістам, щоб прийняти рішення про те, що потрібно вжити.
Для контенту, який все ще присутній на платформі, LinkedIn відстежує сигнали залучення, часові сигнали та сигнали, пов’язані зі спамом, щоб виявити потенціал вірусного спаму протягом життєвого циклу контенту на платформі.

Джерело: engineering.linkedin.com/blog/2023/viral-spam-content-detection-at-linkedin
Функції для прогнозування вірусності
Від моменту публікації контенту на платформі до моменту, коли він стає вірусним, є багато факторів, які впливають на зацікавленість публікації.
Ці фактори включають тип контенту (текст, зображення, відео, стаття тощо), взаємодію учасників із контентом і те, як контент протікає через мережу користувачів LinkedIn.
LinkedIn класифікує ці функції за двома основними категоріями: функції публікації та функції учасників.
Особливості публікації
Функції публікації включають тип контенту, полярність контенту та спам контенту. Розгляд цих факторів для виявлення потенційно вірусного контенту дозволяє LinkedIn побачити, як контент стає вірусним з різною швидкістю, спостерігати кореляцію між балами полярності та якістю контенту та використовувати звіти користувачів як індикатор вмісту спаму.
Особливості учасників
Аналіз функцій учасників, які взаємодіяли з публікацією (ділилися, коментували або реагували) протягом певного періоду часу, дає раннє виявлення вірусності даної публікації.
LinkedIn отримує від них такі особливості:
- Мережеві функції: функції, які кількісно визначають вплив і популярність цих учасників у стрічці, оскільки їхні дії можуть зробити допис доступним набагато більшій кількості учасників, створюючи ефект каскаду, що робить допис вірусним. Тут ЛінкдІн використовує такі функції, як підписники та кількість зв’язків, різноманітність у галузі, місцезнаходження та рівень мережі (зв’язки та підписники) цих учасників.
- Характеристики активності: вони показують, яку залученість отримували їхні дії в минулому, наскільки вони активні на платформі та як довго вони були учасниками LinkedIn.
Особливості залучення
Ці функції базуються на взаємодії, яку отримують публікації у вигляді лайків/реакцій, поширення, коментарів і переглядів.
З них LinkedIn отримує різні характеристики, такі як часові послідовності підрахунків і швидкість лайків/реакцій, поширення, коментарів і переглядів.
Вони діють як найсильніший сигнал для каскадного ефекту, що відбувається в мережі.
Вплив
З часом усі моделі суттєво сприяли зменшенню кількості унікальних глядачів, які стикаються зі спамом.
Завдяки впровадженню проактивної та реактивної моделей LinkedIn успішно знизив загальний відсоток переглядів спаму на 7,3%.
Проактивні моделі були особливо ефективними у ранньому виявленні вмісту спаму, що призвело до зменшення кількості переглядів спаму на 7,6%, тоді як реактивні моделі зменшили його на 2,2%.
Як вторинний вплив LinkedIn помітив зменшення кількості звітів про членів і незацікавленість вмістом на сайті. Крім того, завдяки зусиллям кількість переглядів контенту, що порушує правила, зменшилася на 12%.
Успішно зменшивши кількість глядачів, які отримують доступ до спаму та контенту, що порушує політику платформи, LinkedIn зробив значний крок у напрямку створення безпечнішого та надійнішого онлайн-середовища.
LinkedIn сподівається, що його постійні зусилля щодо вдосконалення моделей виявлення контенту забезпечать кращий досвід використання платформи усім користувачам.
Джерело: LinkedIn





