Katsaus: Google Cloud AI valaisee koneoppimisen

Googlella on yksi alan suurimmista koneoppimispinoista, joka keskittyy tällä hetkellä Google Cloud AI- ja Machine Learning Platform -ympäristöihin. Google kehitti TensorFlow'n avoimen lähdekoodin vuosia sitten, mutta TensorFlow on edelleen kypsin ja yleisimmin mainittu syvällisen oppimisen kehys. Samoin Google kehitti Kubernetesin avoimen lähdekoodin vuosia sitten, mutta se on edelleen hallitseva konttienhallintajärjestelmä.

Google on yksi kehittäjien, datatieteilijöiden ja koneoppimisen asiantuntijoiden tärkeimmistä työkalujen ja infrastruktuurin lähteistä, mutta historiallisesti Google AI ei ole ollut niin houkutteleva yritysanalyytikoille, joilla ei ole vakavaa datatiedettä tai ohjelmointitausta. Se alkaa muuttua.

Google Cloud AI ja Machine Learning Platform sisältää tekoälyn rakennuspalikat, tekoälyalustan ja kiihdyttimet sekä tekoälyratkaisut. Tekoälyn ratkaisut ovat melko uusia, ja ne on tarkoitettu pikemminkin yritysjohtajille kuin datatieteilijöille. Ne voivat sisältää Googlen tai sen kumppaneiden kuulemisen.

Esikoulutettuja, mutta muokattavia tekoälyn rakennuspalikoita voidaan käyttää ilman intiimiä tietoa ohjelmoinnista tai datatieteestä. Siitä huolimatta ammattitaitoiset tutkijat käyttävät niitä usein käytännön syistä, lähinnä saadakseen aikaan asioita ilman laajaa mallikoulutusta.

Tekoälyalusta ja kiihdyttimet ovat yleensä tarkoitettu vakaville tiedetieteilijöille, ja ne edellyttävät koodaustaitoa, tiedon valmistelutekniikoiden tuntemusta ja paljon koulutusta. Suosittelen menemään sinne vasta kokeilemalla asiaankuuluvia rakennuspalikoita.

Google Cloudin tekoälytuotteissa on edelleen joitain puuttuvia linkkejä, erityisesti tietojen valmistelussa. Lähin asia, jonka Google Cloudilla on tietojen tuonti- ja ehdollistamispalveluihin, on Trifactan kolmannen osapuolen Cloud Dataprep; Yritin sitä vuosi sitten ja olin hukkua. Cloud AutoML -taulukkoihin sisäänrakennettu ominaisuuksien suunnittelu on kuitenkin lupaavaa, ja olisi hyödyllistä, että tällainen palvelu olisi käytettävissä muissa tilanteissa.

Tekoälyn saumaton alaosa liittyy etiikkaan ja vastuuseen (tai sen puutteeseen) sekä pysyviin mallivirheisiin (usein harjoitteluun käytetyn puolueellisen datan vuoksi). Google julkaisi tekoälyperiaatteensa vuonna 2018. Se on keskeneräinen työ, mutta se on perusta ohjeistukselle, kuten keskusteltiin äskettäisestä vastuullista tekoälyä koskevasta blogikirjoituksesta.

Tekoälymarkkinoilla on paljon kilpailua (yli tusina myyjää) ja paljon kilpailua julkisilla pilvimarkkinoilla (yli puoli tusinaa uskottavaa myyjää). Jotta vertailut olisivat oikeita, minun on kirjoitettava artikkeli vähintään viisi kertaa niin kauan kuin tämä, joten niin paljon kuin vihaan jättää ne pois, minun on jätettävä pois useimmat tuotevertailut. Ylimmän ilmeisen vertailun vuoksi voin tiivistää: AWS tekee suurimman osan siitä, mitä Google tekee, ja on myös erittäin hyvä, mutta yleensä veloittaa korkeampia hintoja.

Google Cloud AI -rakennuspalikat

Google Cloud AI -rakennuspalikat ovat helppokäyttöisiä komponentteja, jotka voit sisällyttää omiin sovelluksiisi, jotta voit lisätä näkyvyyttä, kieltä, keskustelua ja jäsenneltyjä tietoja. Monet tekoälyn rakennuspalikoista ovat valmiiksi koulutettuja hermoverkkoja, mutta ne voidaan räätälöidä siirto-oppimisen ja hermoverkkohakujen avulla, jos ne eivät palvele tarpeitasi heti. AutoML-taulukot on hieman erilainen siinä mielessä, että se automatisoi prosessin, jonka datatieteilijä käyttäisi löytääkseen parhaan koneoppimismallin taulukkotietojoukolle.

AutoML

Google Cloud AutoML -palvelut tarjoavat räätälöityjä syvähermoverkkoja kieliparien käännöksille, tekstiluokitukselle, esineiden havaitsemiselle, kuvaluokitukselle sekä videoobjektien luokitukselle ja seurannalle. He tarvitsevat merkittyjä tietoja koulutukseen, mutta eivät vaadi merkittävää tietoa syvällisestä oppimisesta, siirto-oppimisesta tai ohjelmoinnista.

Google Cloud AutoML räätälöi Googlen taistelutestatut, erittäin tarkat syvät hermoverkot tunnisteillesi. Sen sijaan, että aloitettaisiin alusta alkaen, kun harjoitellaan malleja datastasi, AutoML toteuttaa automaattisen syväsiirto-oppimisen (mikä tarkoittaa, että se alkaa olemassa olevasta syvästä hermoverkosta, joka on koulutettu muuhun dataan) ja hermoarkkitehtuurihakuun (mikä tarkoittaa, että se löytää oikean yhdistelmän ylimääräisiä verkkokerroksia) ) kieliparien käännöksille ja muille yllä luetelluille palveluille.

Kullakin alueella Googlella on jo yksi tai useampi valmiiksi koulutettu palvelu, joka perustuu syviin hermoverkkoihin ja valtaviin leimattuihin tietoihin. Nämä voivat hyvinkin toimia tietojesi muokkaamattomana, ja sinun on testattava tämä säästääksesi aikaa ja rahaa. Jos he eivät tee sitä, mitä tarvitset, Google Cloud AutoML auttaa sinua luomaan mallin, joka tekee niin, ilman että sinun tarvitsee tietää, kuinka voit siirtää siirtoa tai suunnitella hermoverkkoja.

Siirto-oppiminen tarjoaa kaksi suurta etua verrattuna hermoverkon harjoittamiseen alusta alkaen. Ensinnäkin se vaatii paljon vähemmän tietoa koulutukseen, koska suurin osa verkon kerroksista on jo hyvin koulutettuja. Toiseksi se harjoittaa paljon nopeammin, koska se optimoi vain viimeiset kerrokset.

Vaikka Google Cloud AutoML -palvelut esitettiin aiemmin yhdessä pakettina, ne on nyt lueteltu valmiiksi koulutettujen peruspalveluidensa kanssa. Mitä useimmat muut yritykset kutsuvat AutoML: ksi, suorittaa Google Cloud AutoML Tables.

Lue Google Cloud AutoML: n koko arvostelu

AutoML-taulukot

Tavanomainen tietojenkäsittelyprosessi monille regressio- ja luokitteluongelmille on luoda tietotaulukko harjoittelua varten, puhdistaa ja hoitaa tiedot, suorittaa ominaisuuksien suunnittelu ja yrittää kouluttaa kaikkia sopivia malleja muunnellussa taulukossa, mukaan lukien vaihe optimoimiseksi parhaiden mallien hyperparametrit. Google Cloud AutoML -taulukot voivat suorittaa koko prosessin automaattisesti, kun tunnistat kohdekentän manuaalisesti.

AutoML-taulukot etsivät automaattisesti strukturoitua dataa Googlen mallieläintarhasta ja löytävät tarpeisiisi parhaimman mallin aina lineaarisista / logistisista regressiomalleista yksinkertaisempiin tietojoukoihin edistyneisiin syvä-, yhdistelmä- ja arkkitehtuurihakumenetelmiin suurempiin, monimutkaisempiin. Se automatisoi ominaisuuksien suunnittelun useilla taulukkomuotoisilla primitiiveillä - kuten luvut, luokat, merkkijonot, aikaleimat ja luettelot - ja auttaa havaitsemaan puuttuvia arvoja, poikkeavuuksia ja muita yleisiä dataongelmia.

Sen kooditon käyttöliittymä opastaa sinut koko koneoppimisen koko elinkaaren läpi, mikä tekee jokaisen tiimisi jäsenestä helpoksi rakentaa malleja ja sisällyttää ne luotettavasti laajempiin sovelluksiin. AutoML-taulukot tarjoavat laajan tulodatan ja mallin käyttäytymisen selitettävyysominaisuudet sekä suojakaiteet yleisten virheiden estämiseksi. AutoML-taulukot ovat saatavilla myös API- ja kannettavien ympäristöissä.

AutoML-taulukot kilpailevat Driverless AI: n ja useiden muiden AutoML-toteutusten ja kehysten kanssa.

Vision API

Google Cloud Vision -sovellusliittymä on valmiiksi koulutettu koneoppimispalvelu kuvien luokittelemiseen ja erilaisten ominaisuuksien purkamiseen. Se voi luokitella kuvat tuhansiin ennalta koulutettuihin luokkiin, yleisiin esineisiin ja kuvassa oleviin eläimiin (kuten kissa), yleisiin olosuhteisiin (esimerkiksi hämärä), tiettyihin maamerkkeihin (Eiffel-torni, Grand Canyon), ja tunnistaa kuvan yleiset ominaisuudet, kuten hallitsevat värit. Se voi eristää alueet, jotka ovat kasvoja, ja käyttää sitten geometrisia (kasvojen suuntaus ja maamerkit) ja emotionaalisia analyysejä kasvoille, vaikka se ei tunnista kasvojen kuulumista tiettyihin ihmisiin lukuun ottamatta julkkiksia (mikä edellyttää erityistä käyttöoikeutta). Vision-sovellusliittymä käyttää OCR-toimintoa tekstin tunnistamiseen kuvista yli 50 kielellä ja erilaisilla tiedostotyypeillä. Se voi myös tunnistaa tuotemerkit ja havaita aikuisille suunnatun, väkivaltaisen ja lääketieteellisen sisällön.

Lue Google Cloud Machine Learning -sovellusliittymien koko arvostelu

Video Intelligence -sovellusliittymä

Google Cloud Video Intelligence -sovellusliittymä tunnistaa automaattisesti yli 20000 kohdetta, paikkaa ja toimintaa tallennetussa ja suoratoistetussa videossa. Se erottaa myös kohtausten muutokset ja poimii rikkaat metatiedot video-, kuva- tai kehystasolla. Se suorittaa lisäksi tekstintunnistuksen ja poiminnan OCR: n avulla, tunnistaa nimenomaisen sisällön, automatisoi tekstityksen ja tekstityksen, tunnistaa logot ja tunnistaa kasvot, henkilöt ja asennot.

Google suosittelee Video Intelligence -sovellusliittymää metatietojen purkamiseen videosisällön indeksointiin, järjestämiseen ja hakemiseen. Se pystyy litteroimaan videoita ja luomaan suljettuja tekstityksiä sekä ilmoittamaan ja suodattamaan sopimattoman sisällön - kaikki kustannustehokkaammin kuin ihmisen litteraattorit. Käyttötapauksia ovat sisällön maltillisuus, sisältösuositukset, mediaarkistot ja asiayhteyteen liittyvät mainokset.

Luonnollisen kielen sovellusliittymä

Luonnollisen kielen käsittely (NLP) on iso osa "salaista kastiketta", joka saa syötteen Google-hakuun ja Google Assistantiin toimimaan hyvin. Google Cloud Natural Language -sovellusliittymä paljastaa saman tekniikan ohjelmillesi. Se voi suorittaa syntaksianalyysin (katso alla oleva kuva), entiteetin poiminnan, mielipiteiden analyysin ja sisällön luokituksen 10 kielellä. Voit määrittää kielen, jos tiedät sen. muuten sovellusliittymä yrittää tunnistaa kielen automaattisesti. Erillinen sovellusliittymä, joka on tällä hetkellä saatavilla varhaisessa vaiheessa pyynnöstä, on erikoistunut terveydenhuoltoon liittyvään sisältöön.

Lue Google Cloud Machine Learning -sovellusliittymien koko arvostelu

Käännös

Google Cloud Translation -sovellusliittymä voi kääntää yli sata kieliparia, voi tunnistaa lähdekielen automaattisesti, jos et määritä sitä, ja sillä on kolme makua: Perus-, Lisäasetukset ja Mediakäännös. Advanced Translation -sovellusliittymä tukee sanastoa, eräkäännöstä ja mukautettujen mallien käyttöä. Basic Translation -sovellusliittymä on pohjimmiltaan sitä, mitä kuluttaja Google Translate -käyttöliittymä käyttää. AutoML-käännöksen avulla voit kouluttaa mukautettuja malleja siirto-oppimisen avulla.

Media Translation -sovellusliittymä kääntää sisältöä suoraan äänestä (puheesta), joko äänitiedostoista tai suoratoistona, 12 kielellä ja luo automaattisesti välimerkit. Video- ja puheluäänille on erilliset mallit.

Lue Google Cloud Machine Learning -sovellusliittymien koko arvostelu