7 kroků ke strojovému učení: Jak se připravit na automatizovanou budoucnost

Obrázek: Sdecoret / Shutterstock

Stále více digitální ekonomika vyžaduje, aby správní rady a vedoucí pracovníci dobře rozuměli rychle se měnícímu digitálnímu prostředí. Umělá inteligence (AI) je přirozeně důležitou zúčastněnou stranou. Organizace, které se chtějí připravit na automatizovanou budoucnost, by měly důkladně porozumět AI. AI je však zastřešující pojem, který zahrnuje více oborů, z nichž každá ovlivňuje podnikání poněkud odlišným způsobem.

Když se podíváme na umělou inteligenci, lze ji rozdělit do tří různých domén:

  1. Robotika, která se zabývá fyzickým světem a může přímo interagovat s lidmi. Robotika může být použita ke zlepšení naší práce různými způsoby. Včetně Fordova exoskeletu nebo pomocných robotů Boston Dynamics.
  2. Kognitivní systémy, které se zabývají lidským světem. Skvělým příkladem kognitivního systému jako součásti umělé inteligence jsou chatboti. Chatboty jsou velmi hmatatelným příkladem, kde lidé a stroje spolupracují na dosažení cíle. Chatbot je komunikační rozhraní, které pomáhá jednotlivcům a organizacím vést konverzaci.
  3. Strojové učení, které se zabývá informačním světem. Stroje využívají data k učení a cílem strojového učení je odvodit z nich význam. Strojové učení používá statistické metody, které umožňují strojům zlepšit se stroji. Podmnožinou strojového učení je hluboké učení, které umožňuje vícevrstvé neuronové sítě.

Umělá inteligence spočívá v bezproblémové integraci robotiky, kognitivních systémů a strojového učení.

Obrázek 1: Umělá inteligence - upraveno z Goel & Davies, 2019

7 kroků ke strojovému učení

Pojďme se ponořit trochu hlouběji do jedné z těchto domén: strojové učení. Cílem strojového učení je odvodit význam z dat. Data jsou proto klíčem k odemknutí strojového učení. K učení stroje existuje sedm kroků a každý krok se točí kolem dat:

Obrázek 2: 7 kroků ke strojovému učení

1. Sběr dat

Strojové učení vyžaduje tréninková data, mnoho z nich (buď označeno, což znamená učení pod dohledem nebo neoznačené, což znamená učení bez dozoru). Sběr dat, nebo datafikace, je také prvním krokem v mém novém modelu D2 + A2.

2. Příprava dat

Samotná surová data nejsou příliš užitečná. Data je třeba připravit, normalizovat, zbavit duplikátů a odstranit chyby a zkreslení. Vizualizaci dat lze použít k vyhledání vzorců a odlehlých hodnot, abyste zjistili, zda byla shromážděna správná data nebo zda data chybí.

3. Výběr modelu

Třetí krok spočívá v výběru správného modelu. Existuje mnoho modelů, které lze použít k mnoha různým účelům. Po výběru modelu se musíte ujistit, že model splňuje obchodní cíl. Kromě toho byste měli vědět, kolik přípravy model vyžaduje, jak přesný je a jak škálovatelný je model. Složitější model ne vždy představuje lepší model. Mezi běžně používané algoritmy strojového učení patří lineární regrese, logistická regrese, rozhodovací stromy, K-prostředky, analýza hlavních komponent (PCA), Support Vector Machines (SVM), Naivní Bayes, Random Forest a neuronové sítě.

4. Školení

Výcvik vašeho modelu je součástí strojového učení. Cílem je využít vaše tréninková data a postupně vylepšovat předpovědi modelu. Každý cyklus aktualizace závaží a zkreslení je jeden tréninkový krok. Ve strojovém učení pod dohledem je model konstruován s použitím označených vzorových dat, zatímco bez dozoru se strojové učení snaží vyvodit závěry z neoznačených dat (bez odkazů na známé nebo označené výsledky).

5. Hodnocení

Po tréninku přichází model s hodnocením modelu. To vyžaduje testování strojového učení proti nepoužitému souboru dat o kontrole, aby bylo vidět, jak funguje. To by mohlo představovat, jak model funguje v reálném světě, ale nemusí tomu tak být. Čím větší počet proměnných ve skutečném světě, tím větší by měly být údaje o školení a zkouškách.

6. Ladění parametrů

Po vyhodnocení modelu byste měli vyzkoušet původně nastavené parametry a vylepšit AI. Zvyšování počtu tréninkových cyklů může vést k přesnějším výsledkům. Měli byste však definovat, kdy je model dostatečně dobrý, jinak bude model vyladěn. Toto je experimentální proces.

7. předpověď

Jakmile jste prošli procesem sběru dat, přípravou dat, výběrem modelu, zaškolením a vyhodnocením modelu a vyladěním parametrů, je čas odpovědět na otázky pomocí předpovědí. Mohou to být všechny druhy předpovědí, od rozpoznávání obrazu po sémantiku až po prediktivní analýzu.

Závěrečné myšlenky

Strojové učení umožňuje softwaru stát se přesným v předpovídání výsledků. V nadcházejících letech to posílí mnoho, ne-li všechny, obchodní procesy. Strojové učení se tak stane nedílnou součástí automatizované organizace zítřka. Díky stále rychlejšímu hardwaru uvidíme výkonnější modely nabízející lepší předpovědi.

Problém zkreslených modelů bohužel díky zkresleným datům a zkresleným datovým vědcům nikdy není daleko. Proto, aby organizace skutečně využívaly AI, měly by zajistit, aby jejich modely a data byly zkreslené, dobře vyškolené a vyhodnocené a řádně vyladěné. Teprve potom budou organizace skutečně těžit z strojového učení.

Pokud se mi podařilo udržet vaši pozornost k tomuto bodu, zanechte komentář popisující, jak tento příběh pro vás změnil, nebo se přihlaste k odběru mého týdenního zpravodaje, abyste dostávali více tohoto obsahu:

Mark Mark Rijmenam je zakladatelem společnosti Datafloq, je celosvětově uznávaným řečníkem v oblasti velkých dat, blockchainu a umělé inteligence, stratégem a autorem 3 knih o hospodaření: Think Bigger, Blockchain a The Organization of Tomorrow. Zde si můžete zdarma přečíst náhled mé poslední knihy. Spojte se se mnou na LinkedIn nebo řekněte ahoj na Twitteru zmínku o tomto příběhu.

Pokud byste se mnou chtěli mluvit o jakékoli poradenské činnosti nebo mluvení, pak mě můžete kontaktovat na adrese https://vanrijmenam.nl