обучение

Всеки път, когато правим снимки с нашия смартфон, търсим в интернет, публикуваме в социалните мрежи или използваме GPS на мобилния телефон, оставяме пръстовите си отпечатъци на света. Ние генерираме огромни количества данни всяка минута и цифрите ще нарастват само през следващите няколко години: добре дошли в ерата на мащабните данни и хиперинформацията.

За бизнеса този сценарий представлява обезпокоително предизвикателство: как обработвате тонове неструктурирана информация бързо и ефективно?

През последните години машинното обучение се превърна в стратегически фокус на дигиталните иновации в бизнеса и трансформира начина им на работа, автоматизира процесите и позволява прозрения в реално време. Нека започнем в началото:

Какво е машинно обучение?

Машинното обучение е поддисциплина в областта на изкуствения интелект (AI), способна да създава алгоритми, които позволяват на компютрите научете се да изпълнявате задачи от данни, вместо да бъде изрично програмиран. Тези "модели" са в състояние да идентифицират модели от данните за обучение (примери) и са в състояние да предсказват бъдещи събития с определено ниво на увереност и да вземат решения без човешка намеса. Това е особено ценно за обработка на големи бази данни и автоматизиране на процеси.

За Spotify използването на машинното обучение е централно в стратегията им: позволява им да предлагат персонализирани музикални изживявания на своите потребители и да препоръчват нови песни въз основа на техните вкусове и интереси.

Google от своя страна го използва, за да блокира СПАМ съобщенията от входящите кутии на своите потребители в Gmail. Благодарение на алгоритъм, обучен с машинно обучение, той анализира милиони съобщения и е способен да открива потенциално нежелани модели на имейли.

На свой ред тази технология има тесни връзки с друга област на изследване, извлечена от AI: обработка на естествен език (NLP). НЛП се стреми да могат компютрите разбират човешкия език: не само по отношение на това, което казва текст или говорител, но - особено - на това какво означава: намерението, усещането, темата. За да анализира тези писмени или устни съобщения, NLP интегрира понятия за машинно обучение, лингвистика и компютърни науки.

Комбинацията от NLP и машинно обучение позволява изграждане на модели, способни да се научат да тълкуват човешки език. Една от най-интересните области, свързани с това, е анализ на текст: анализира текст автоматично.

Как се използва машинното обучение за анализ на текст?

По принцип автоматичният анализ на текста използва две специфични техники: класификация и екстракция.

Моделите за класификация на текст работят чрез присвояване на категории на данни според съдържанието им. Това позволява задачи като анализ на настроението (откриване на усещането за текст), анализ на теми (идентифициране на неговата тема или тема), откриване на език (откриване на езика, на който е написан) и откриване на намерения (идентифициране на намерението, изразено от автора на текста). Например, бихме могли да използваме текстов класификатор, за да анализираме съдържанието на хиляди туитове за марка и да класифицираме настроението на всяко съобщение като „положително“, „отрицателно“ или „неутрално“.

Моделите за извличане на текст, от друга страна, се основават на идентифициране и получаване на определени части от информацията, присъстващи в даден текст. Използва се в задачи като извличане на ключови думи (идентифициране на най-подходящите ключови думи в даден текст), разпознаване на субекти (идентифициране на имената на хора или компании) и извличане на резюме (правене на обобщение на текст) Ако нашата цел беше да извлечем имена на компании, спецификации на продукти или други данни, които присъстват в даден текст, трябва да използваме модели за извличане.

Какви приложения има в индустрията?

В MonkeyLearn * имаме клиенти от различни области и отрасли, които използват машинно обучение за автоматизиране на процесите, спестяване на часове ръчен труд, получаване на ценна информация от анализа на данните и използването й за вземане на по-добри бизнес решения.

Досега областите, в които сме работили най-много, са поддръжка на клиенти и обратна връзка с клиентите.

Поддръжка на клиенти

Благодарение на машинното обучение и NLP, екипите за поддръжка на клиенти могат да автоматизират някои от ежедневните си процеси и да получат ценна информация от анализа на разговорите с клиентите си.

Чрез използването на модели, които позволяват идентифициране на теми или теми, класифицирането им според настроението или намерението на клиента, откриване на кой език са намерени и - нещо много важно в тази област - определяне на нивото на спешност на съобщението, отдел за поддръжка на клиенти може:

  • Автоматично маркирайте билети за поддръжка със запитвания или оплаквания (нещо, което се прави ръчно),
  • Автоматично извличайте билети до най-подходящите екипи, които да се справят с тях (например, ако пристигне техническо запитване, техническият екип се препраща автоматично),
  • Открийте спешността на билета и го приоритизирайте своевременно (например, ако клиент на сайт за електронна търговия се оплаква, че продуктът е доставен счупен).

Обратна връзка от клиента

MonkeyLearn също е много полезен за обработка на всякакви отзиви на клиенти, независимо дали става въпрос за отговори от анкети за удовлетвореност, отзиви за продукти и коментари в социалните медии, наред с други.

По прост и бърз начин нашата платформа позволява създаването на модели за машинно обучение, за да се разбере и структурира тази обратна връзка автоматично и по този начин да бъде в състояние да получи ценна информация за вземане на решения. Това избягва задачата за ръчно четене на всеки текст, като по този начин спестява време и ресурси за компаниите.

Проучванията NPS (Net Promoter Score) например са един от най-популярните показатели за обратна връзка с клиентите. Те позволяват да се измери лоялността на потребителите към продукт или услуга и да се класифицират като промоутъри или недоброжелатели. В допълнение към числения рейтинг, тези проучвания включват последващ въпрос в стил „защо ни дадохте тази оценка?“. Тези отворени отговори често са по-трудни за обработка и могат да имат несъответствия.

Нека си представим, че потребител присвоява оценка 6 на дадена компания и след това коментира: „Продуктът е страхотен, обожавам неговия UX и е много лесен за използване. Лошото е цената му: тя е твърде скъпа ”. Обработката на този коментар изисква присвояване на категории или тагове, например, както следва:

  • „Продуктът е страхотен, обожавам неговия UX и е много лесен за използване“:
    • Аспекти: UX, лесна употреба
    • Чувство: Положително.
  • „Лошото е цената му: твърде скъпо е“:
    • Аспекти: Цена.
    • Чувство: Отрицателно.

Сега си представете да обработите 5000 такива отговора ръчно. това е скъпо, бавно и досадно за компаниите.

Използването на машинно обучение за анализ на отворени отговори ви позволява да добавите ново измерение към вашите данни. Това не само дава възможност за автоматично интерпретиране на настроенията на потребителите (анализ на настроенията), но също така и за това за какви аспекти или теми те говорят (откриване на теми) и какви конкретни термини се появяват често във връзка с тези теми (извличане на ключови думи). С резултатите от тези анализи се получават прозрения, които значително подобряват вземането на решения и позволяват на компаниите да се съсредоточат върху подобряването на опита в ключовите точки за клиентите

Как да го прилагате в компаниите?

В MonkeyLearn предлагаме различни опции за модели с машинно обучение. Изборът на най-удобния ще зависи от конкретните нужди на всяка компания или район.

За тези, които искат да започнат веднага, имаме предварително обучени модели за автоматичен анализ на английски текстове. Например, този предварително обучен модел за анализ на настроението постига резултати, близки до състоянието на техниката.

От друга страна, ние считаме, че всеки проблем е уникален и че много пъти, за да се получи по-голяма точност в прогнозите, е необходимо да се изгради персонализиран модел за машинно обучение. За това разработихме графичен интерфейс в рамките на MonkeyLearn, който позволява на потребителите без програмиране или знания за машинно обучение лесно да създадат модел на класификация или извличане, импортирайки техните данни, създавайки свои собствени маркери и използвайки техните лични критерии за обучение на алгоритъма. Понастоящем моделите могат да бъдат обучени да анализират текстове на повече от 20 езика, включително испански, английски, португалски, немски, италиански, френски, китайски, японски и др.

Като цяло нашите клиенти започват с използване на предварително обучен модел и след това преминават към обучение на персонализирани модели за по-голяма прецизност и детайлност.

Съвети за първите стъпки

Основната препоръка за тези, които започват с машинно обучение е напредвайте постепенно. Започнете с обучение само на един или два модела за конкретни задачи, наблюдавайте каква стойност добавя към компанията и чак тогава измислете нови модели за опростяване на други процеси.

Лесно е да се изкушите да искате да автоматизирате много процеси едновременно. Но това е просто поразително и разочароващо, губене на време и стойност за бизнеса. Въпреки че машинното обучение е по-достъпно от всякога, необходимо е да се има предвид, че то има крива на обучение и че обикновено изисква да се правят промени в определени вътрешни процеси на компаниите, преди те да са готови да стартират.

Вторият ни съвет при обучението на първи модел с машинно обучение е фокус върху качеството на данните. Вярно е, че колкото повече примери се използват за обучение на модел, толкова по-точни ще бъдат неговите прогнози. Но в крайна сметка качеството на данните има по-голяма тежест.

За предпочитане е да се използват 1000 примера за обучение, но се уверете, че те са добре маркирани и че са представителни за ситуациите, на които искате да преподавате модела, отколкото да използвате три пъти повече примери, но с грешки при етикетиране (етикетът, който е присвоен към примера) или които не са много подходящи за проблема, който трябва да се моделира.

Използването на машинно обучение за анализ на текстове автоматично отваря вратите към безкрайни възможности за подобрения и конкурентни предимства за компаниите. Истинската стойност на данните не се крие само в това, че ги има, а в това да ги накарат да говорят и да могат да ги използват като ръководство за вземане на по-добри решения: предвиждане на криза, подобряване на продукт, разграничаване от конкуренцията.

Първите стъпки с машинното обучение могат да бъдат много лесни. Ако сте любопитни и искате да проучите възможностите, които може да предложи за вашия проект или бизнес, ви каним да се регистрирате в MonkeyLearn и да изпробвате платформата.

* MonkeyLearn е платформа, родена в Уругвай, която предлага решения на компаниите за извършване на автоматичен анализ на текстове с машинно обучение.