Foto Mpho Mojapelo na Unsplash

API rozhraní AI: Co jsou a jak je používat

Sada lepších postupů pro API umělé inteligence

Zajímá vás rozhraní API pro převod řeči na text, překlad jazyka nebo rozpoznávání obrázků? Máš štěstí! Existuje spousta služeb, které vám to umožňují, a také spousta důvodů pro použití API umělé inteligence (AI) ve vašich aplikacích. V tomto článku popíšeme některé případy použití rozhraní API API AI a poté hovoříme o osvědčených postupech při jejich používání.

Pokud jste ve spěchu, spěchejte k TL; DR dole.

První otázka před implementací externí služby, kterou si musíte položit, je „Potřebuji to“? Pokud jde o API založená na umělé inteligenci, může být odpověď komplikována! Abychom vám pomohli při rozhodování, podívejme se na dvě z nejčastěji používaných služeb a kdy byste je měli (nebo neměli) používat.

Použijte případ č. 1: Řeč na text

Mnoho aplikací dnes využívá možnosti převodu řeči na text - a pravděpodobně jste už použili ten, který tak dělá. Siri, Google Assistant, Bixby nebo Alexa to všichni používají, ale to není vše. Používají se také aplikace pro zasílání zpráv (např. WhatsApp) a vyhledávače (např. Vyhledávací lišta Google).

Možná se divíte, kde je AI. Není to jen transkripce řeči?

Základem jakéhokoli rozhraní API pro převod řeči na text je skutečně vzít zvuk řeči jako vstup a přepsat jej do textu, i když se to tady nezastaví, a to je okamžik, kdy se stane kouzlo umělé inteligence. Pro většinu dostupných rozhraní API bude také:

  • změnit předchozí přepis na základě kontextu
  • identifikovat různé reproduktory
  • být schopen hledat konkrétní klíčová slova
  • umožňují přizpůsobení modelu (užitečné pro regionální akcenty)

Použijte toto: pro konkrétní případy použití, například během syntézy řeči během zkoušky, kde je důležitý kontext, použitá slova a současný řečník.

Nepoužívejte toto: pokud čekáte pouze na jednoho reproduktoru nebo na jednoduché textové zprávy. V takovém případě většina klávesnic smartphonů již obsahuje funkci rozpoznávání řeči, kterou lze použít, a pro webovou aplikaci můžete použít rozhraní SpeechSynthesis API.

Použijte případ č. 2: Rozpoznávání obrazu

Ve srovnání s funkcí Speech-to-Text existuje v současné době pouze několik aplikací, které používají funkci Rozpoznávání obrázků, a většina z nich je zcela specifická (např. PlantNet, který identifikuje rostliny, ze kterých fotografujete). Začneme však s obecným používáním, konkrétně s:

  • Objektiv Google: analyzuje, co je na obrazovce (obrázek nebo ne), a na jeho základě se pokusí identifikovat adresy, místa, věci a doporučit výsledky.
  • Zobrazení AI: aplikace pro zrakově postižené, která popisuje, co je kolem nich (podle toho, kam směřuje fotoaparát telefonu)
Použití objektivu Google k rozpoznání místa

Jak jste již pochopili, kouzlem je pořídit obrázek jako vstup a pokusit se zjistit, co je na uvedeném obrázku. Pro většinu poskytovatelů existují dva způsoby:

  • Používání předškolených modelů: zahrnují běžné třídy (jídlo, místa, lidé, barva ...)
  • Používání vlastních klasifikátorů: umožňuje uživatelům trénovat své vlastní třídy (jak je vidět výše u PlantNet)

Ačkoli některá zařízení Android a iOS mají vestavěné funkce rozpoznávání obrázků, jako vývojář je nemůžete vždy dotazovat z aplikace. Proto, pokud se váš případ použití hodí, měli byste jej používat.

Použijte případy č. 3, č. 4…

Existuje spousta dalších API rozhraní AI. V tomto příspěvku jim nebudeme procházet všechny, ale pokud uvažujete o použití jednoho z nich a nejste si jisti, zda váš případ použití vyhovuje potřebě nebo ne, zanechte komentář nebo mě přímo kontaktujte. Rád vám pomůžu!

Nyní jste se rozhodli použít jedno, dvě nebo více (v tom případě zde pro vás článek) rozhraní API AI ve vaší aplikaci. V této části uvidíme několik lepších postupů, které je třeba přijmout, než začneme uvažovat o jejich použití ve výrobě.

Zkuste před nákupem

Stejně jako u každé třetí strany API existují i ​​parametry, které je třeba brát v úvahu - cena, použitelnost, dostupnost ... ale pokud jde o umělou inteligenci, je zde také faktor spolehlivosti. Spolehlivost není binární ohled a vyhrál ' t sazba 0 nebo 1. Ve skutečnosti to bude cokoli mezi 0 a 1, jak uvidíme v další části!

Všichni hlavní poskytovatelé cloudových služeb poskytují svou vlastní sadu API API AI a všichni mají buď demonstrační stránku, nebo bezplatnou zkušební verzi. Využijte toho, vyzkoušejte sami a vyberte ten, který získá nejlepší výsledky!

  • IBM Watson
  • Google Cloud AI
  • Kognitivní služby společnosti Microsoft
  • Služby AWS AI

Existují také platformy pro specifické služby, jako je Clarifai (Vision API), SAP Conversational AI (Chatbots), nebo jednoduché vyhledávání podle vašeho oblíbeného vyhledávače.

Příklad volání služby Watson Assistant pomocí Postmanu

Umělá inteligence se rýmuje s důvěrou

Jak již bylo řečeno v předchozí části, pokaždé, když dostanete odpověď z AI API, bude také obsahovat úroveň spolehlivosti od 0 do 1, což odpovídá procentu jistoty, že něco rozpoznalo.

Vezměme si příklad s rozhraním Visual Recognition API při odesílání následujícího obrázku:

Kredity: Getty.com

Zde je odpověď JSON. Odstranil jsem některé třídy kvůli čitelnosti.

[{"classifier_id": "default", "name": "default", "classes": [{"class": "bus", "score": 0.797}, {"class": "mechanické zařízení", " score ": 0.506}, {" class ":" Indian red color "," score ": 0.799}]," display ":" General Model "," description ":" Rychle pochopíte objekty, akce, scény a barvy uvnitř obrázek." }]

V tomto případě máme třídu, která je identifikována spolu se skóre spolehlivosti. Zohlednění tohoto skóre je klíčové. Obvykle doporučuji minimální skóre spolehlivosti 95%. Toto skóre by se mělo postupem času zvyšovat, protože vy nebo váš poskytovatel API přidáte do modelů více tréninkových dat.

Když už mluvíme o tréninkových datech, budete chtít zvážit, zda chcete, aby data odeslaná z vaší aplikace byla použita ke zlepšení obecných modelů vašeho poskytovatele. Pokud to chcete povolit, musíte o tom uživatele výslovně informovat.

TL; DR:

  • Před použitím rozhraní API AI se rozhodněte, zda to opravdu potřebujete
  • Pokud tak učiníte, zkuste různé poskytovatele a vyberte poskytovatele, který nejlépe vyhovuje vašemu případu použití
  • Ujistěte se, že máte dostatečně vysoký práh spolehlivosti, abyste se vyhnuli falešným pozitivům

Bavte se infuzí AI do svých aplikací!