Ohjelmointi

Nykyisiä tietojenkäsittelyrooleja ei ole olemassa kymmenessä vuodessa

Tulevalla vuosikymmenellä datatieteilijän rooli, sellaisena kuin tiedämme sen, näyttää hyvin erilaiselta kuin nykyään. Mutta älä huoli, kukaan ei ennusta menetettyjä työpaikkoja, vain muuttunut työpaikkoja.

Datatieteilijät ovat kunnossa - Bureau of Labor Statistics -lehden mukaan roolin ennustetaan edelleen kasvavan keskimääräistä korkeammalla leikkeellä vuoteen 2029 saakka. Mutta teknologian edistyminen on sysäys valtavalle siirtymälle datatieteilijän vastuualueissa ja tehtävissä tapa, jolla yritykset lähestyvät analytiikkaa kokonaisuutena. Ja AutoML-työkalut, jotka auttavat automatisoimaan koneoppimisputkea raakatiedoista käyttökelpoiseen malliin, johtavat tämän vallankumouksen.

Kymmenen vuoden kuluttua datatieteilijöillä on täysin erilaiset taidot ja työkalut, mutta heidän tehtävänsä pysyy samana: palvelemaan luotettavina ja pätevinä teknologiaoppaina, jotka voivat ymmärtää monimutkaisia ​​tietoja liike-elämän ongelmien ratkaisemiseksi.

AutoML demokratisoi datatieteen

Viime aikoihin asti koneoppimisalgoritmit ja -prosessit olivat melkein yksinomaan perinteisempien datatieteiden roolien - muodollisen koulutuksen ja korkeakoulututkinnon suorittaneiden tai suurten teknologiayritysten palveluksessa olevien - rooleja. Datatieteilijöillä on ollut korvaamaton rooli koneoppimisen kehityspektrin jokaisessa osassa. Mutta ajan myötä heidän roolistaan ​​tulee entistä yhteistyöhön perustuva ja strategisempi. AutoML: n kaltaisilla työkaluilla joidenkin akateemisten taitojen automatisoimiseksi datatutkijat voivat keskittyä ohjaamaan organisaatioita kohti ratkaisuja yritysongelmiin datan avulla.

Monin tavoin tämä johtuu siitä, että AutoML demokratisoi pyrkimyksiä toteuttaa koneoppiminen käytännössä. Toimittajat startup-yrityksistä pilvipitoisiin liuottimiin ovat esittäneet ratkaisuja, jotka kehittäjät voivat käyttää ja kokeilla riittävän helposti ilman suurta koulutuksellista tai kokemuksellista esteitä markkinoille pääsylle. Vastaavasti jotkut AutoML-sovellukset ovat riittävän intuitiivisia ja yksinkertaisia, jotta ei-tekniset työntekijät voivat kokeilla käsiään ratkaisujen luomisessa omilla osastoillaan - luomalla organisaatioihin eräänlainen "kansantietotieteilijä".

Jotta voimme tutkia tämäntyyppisten työkalujen mahdollisuuksia sekä kehittäjille että datatieteilijöille, meidän on ensin ymmärrettävä tietojenkäsittelyn nykytila ​​koneoppimisen kehittämisen yhteydessä. Se on helpoin ymmärtää, kun sijoitetaan maturiteettiasteikolle.

Pienemmät organisaatiot ja yritykset, joilla on perinteisemmät roolit digitaalisesta muutoksesta (eli ei klassisesti koulutetut datatieteilijät) kuuluvat tyypillisesti tämän asteikon tähän päähän. Tällä hetkellä he ovat suurimpia asiakkaita valmiiksi tulleille koneoppimissovelluksille, jotka ovat paremmin suunnattu yleisölle, joka ei tunne koneoppimisen monimutkaisuutta.

  • Plussat: Nämä avaimet käteen -sovellukset ovat yleensä helppoja toteuttaa ja suhteellisen halpoja ja helppoja ottaa käyttöön. Pienemmille yrityksille, joilla on hyvin erityinen prosessi automatisoida tai parantaa, markkinoilla on todennäköisesti useita toteuttamiskelpoisia vaihtoehtoja. Alhainen pääsyn este tekee näistä sovelluksista täydellisiä ensimmäistä kertaa koneoppimiseen kahlueville datatutkijoille. Koska jotkin sovellukset ovat niin intuitiivisia, ne antavat muillekin kuin teknisille työntekijöille mahdollisuuden kokeilla automaatiota ja edistyneitä tietomahdollisuuksia - mahdollisesti tuomalla arvokas hiekkalaatikko organisaatioon.
  • Haittoja: Tämä koneoppimissovellusten luokka on tunnetusti joustamaton. Vaikka niitä voi olla helppo toteuttaa, niitä ei ole helppo mukauttaa. Sinänsä tietyt tarkkuustasot saattavat olla mahdotonta tietyissä sovelluksissa. Lisäksi näitä sovelluksia voi rajoittaa vakavasti niiden riippuvuus ennalta koulutetuista malleista ja tiedoista. 

Esimerkkejä näistä sovelluksista ovat Amazon Comprehend, Amazon Lex ja Amazon Forecast Amazon Web Services -palvelusta sekä Azure Speech Services ja Azure Language Understanding (LUIS) Microsoft Azuresta. Nämä työkalut ovat usein riittäviä, jotta kasvavat tiedetieteilijät voivat ottaa ensimmäiset askeleet koneoppimisessa ja ohjata organisaationsa maturiteettispektriin.

Mukautettavat ratkaisut AutoML: llä

Organisaatiot, joilla on suuria mutta suhteellisen yleisiä tietojoukkoja - ajattelevat asiakastapahtumatiedot tai markkinointiviestitiedot - tarvitsevat enemmän joustavuutta käyttäessään koneoppimista ongelmien ratkaisemiseksi. Anna AutoML. AutoML ottaa manuaalisen koneoppimisen työnkulun vaiheet (tiedonhaku, tutkiva data-analyysi, hyperparametrien viritys jne.) Ja tiivistää ne konfiguroitavaksi pinoksi.

  • Plussat: AutoML-sovellukset mahdollistavat useampien kokeiden suorittamisen datalle suuremmassa tilassa. Mutta AutoML: n todellinen supervalta on helppokäyttöisyys - mukautettuja kokoonpanoja voidaan rakentaa ja syötteitä voidaan puhdistaa suhteellisen helposti. Lisäksi AutoML: ää ei tehdä yksinomaan datatieteilijöiden joukossa. Kehittäjät voivat myös helposti hioa hiekkalaatikossa tuomaan koneoppimisen elementtejä omiin tuotteisiinsa tai projekteihinsa.
  • Haittoja: Vaikka AutoML on lähellä, sen rajoitukset tarkoittavat tulosten tarkkuutta. Tämän vuoksi tutkintoa pitävät, korttia kantavat tiedemiehet suhtautuvat usein halveksivasti AutoML: n avulla rakennettuihin sovelluksiin - vaikka tulos olisi riittävän tarkka ratkaisemaan käsillä olevan ongelman.

Esimerkkejä näistä sovelluksista ovat Amazon SageMaker AutoPilot tai Google Cloud AutoML. Vuosikymmenen kuluttua datatieteilijöiden on epäilemättä tunnettava tällaiset työkalut. Kuten kehittäjällä, joka hallitsee useita ohjelmointikieliä, myös datatieteilijöillä on oltava taito useissa AutoML-ympäristöissä, jotta heidät voidaan pitää huippulahjakkuuksina.

”Käsin valssatut” ja kotimaiset koneoppimisratkaisut 

Suurimpia yritystoimintaa harjoittavia yrityksiä ja Fortune 500 -yhtiöitä kehitetään parhaillaan suurinta osaa edistyneistä ja omista koneoppimissovelluksista. Näiden organisaatioiden datatutkijat ovat osa suuria tiimejä, jotka parantavat koneoppimisalgoritmeja käyttämällä historiallisia yritystietoja ja rakentavat näitä sovelluksia alusta alkaen. Tällaiset mukautetut sovellukset ovat mahdollisia vain huomattavilla resursseilla ja lahjakkuudella, minkä vuoksi tulos ja riskit ovat niin suuret.

  • Plussat: Kuten kaikki tyhjästä rakennetut sovellukset, mukautettu koneoppiminen on huipputekniikkaa ja se perustuu käsillä olevan ongelman syvälliseen ymmärtämiseen. Se on myös tarkempi - jos vain pienillä marginaaleilla - kuin AutoML ja valmiit koneoppimisratkaisut.
  • Haittoja: Mukautetun koneoppimissovelluksen saaminen tiettyjen tarkkuuskynnysten saavuttamiseksi voi olla äärimmäisen vaikeaa, ja datatutkijaryhmät vaativat usein raskasta nostamista. Lisäksi mukautetut koneoppimisvaihtoehdot ovat kaikkein aikaa vievimpiä ja kalleimpia kehittää.

Esimerkki käsin valssatusta koneoppimisratkaisusta on aloittaa tyhjällä Jupyter-muistikirjalla, tuoda tietoja manuaalisesti ja suorittaa sitten jokainen vaihe tutkivasta data-analyysistä mallin viritykseen käsin. Tämä saavutetaan usein kirjoittamalla mukautettu koodi avoimen lähdekoodin koneoppimisen puitteilla, kuten Scikit-learn, TensorFlow, PyTorch ja monet muut. Tämä lähestymistapa vaatii paljon kokemusta ja intuitiota, mutta se voi tuottaa tuloksia, jotka usein ylittävät sekä avaimet käteen -koneoppimispalvelut että AutoML: n.

Työkalut, kuten AutoML, muuttavat datatieteen rooleja ja vastuuta seuraavien 10 vuoden aikana. AutoML ottaa koneoppimisen kehittämisen taakan tyhjästä datatieteilijöiden toimesta ja antaa koneoppimisteknologian mahdollisuudet suoraan muiden ongelmanratkaisijoiden käsiin. Ajan vapautuessa keskittyä tietoonsa - tietoihin ja itse panoksiin - datatutkijat vuosikymmenen kuluttua ovat entistä arvokkaampia oppaita organisaatioilleen.

Eric Miller toimii teknisen strategian vanhempana johtajana Rackspacessa, jossa hän tarjoaa strategisen konsultoinnin johtajuuden, jolla on todistettu kokemus käytännön rakentamisesta Amazon Partner Network (APN) -ekosysteemissä.Eric on saavuttanut teknisen johtajan, jolla on 20 vuoden todistettu menestys yritystietotekniikassa. Hän on johtanut useita AWS- ja ratkaisuarkkitehtuurialoitteita, mukaan lukien AWS Well Architected Framework (WAF) -arviointikumppanuusohjelma, Amazon EC2 for Windows Server AWS Service Delivery Program ja laaja valikoima AWS: n uudelleenkirjoittamisesta monen miljardin dollarin organisaatioille.

New Tech Forum tarjoaa mahdollisuuden tutkia ja keskustella kehittyvistä yritysteknologioista ennennäkemättömällä syvyydellä ja laajuudella. Valinta on subjektiivinen, perustuu valitsemiemme tekniikoihin, joiden uskomme olevan tärkeitä ja kiinnostavia lukijoille. ei hyväksy markkinointivakuuksia julkaisua varten ja pidättää oikeuden muokata kaikkea lähetettyä sisältöä. Lähetä kaikki tiedustelut osoitteeseen [email protected]