Äänihaun ja ääniohjattujen ohjelmistojen aikakausi on tulossa. Kehittäjänä asun ja kuolen näppäimistön avulla, mutta näen jo merkit: Kuten monet ihmiset, esimerkiksi puhun Android-puhelimelleni (esimerkiksi "Navigoi Lowesiin [tai Starbucks tai Harris Teeter]") saada reittiohjeet.
Mary Meekerin vuoden 2016 Internet-trendiraportissa hän kertoo, että Google Voice -hakukyselyt ovat kasvaneet seitsemänkertaiseksi vuodesta 2010. Olen myös huomannut, että 12-vuotias poikani tekee melkein kaikki haut äänellä - ja minun tyttöystävä kirjoittaa minulle tällä tavoin säännöllisesti. Lisäksi yritys, jonka palveluksessa työskentelen, Lucidworks ilmoitti äskettäin uudesta kumppanuudesta IBM: n kanssa Watsonin ja tekstistä puheeksi -ominaisuuksien integroimiseksi yrityksen hakutuotteeseemme.
Tekniikka toimii paljon paremmin kuin ennen, ja se on helpompi integroida sovelluksiin. Jos kehität Android- tai iOS-käyttöjärjestelmää, voit helposti liittää API: t puheentunnistusta varten. Puheentunnistus ei kuitenkaan ala ja päädy yksinkertaisilla puheesta tekstiin ja äänikomennoilla.
Haun tarkoituksen ymmärtäminen on hyvin kontekstuaalinen tehtävä, erityisesti puhutun kielen kohdalla. Lisäksi ihmiset käyttävät yleensä enemmän sanoja luonnollisella puhekielellä kuin hakupalkin kohdatessa. Puhekielellä on enemmän "melusanoja" kuin tavallisessa tekstihakussa.
Nämä ovat merkittäviä tekoälyhaasteita. Mutta kun voitamme kontekstiongelman, kehittäjät oppivat, että enemmän voidaan tehdä äänellä kuin tekstillä. Tunnekontekstilla on merkitystä. Jos etsit huoltoasemaa, haluatko halvimman tai lähimmän? Ääniesi emotionaalinen sisältö voi viitata siihen. Toki, saatat selventää, mutta sinun ei tarvitse.
Sinun puhelias tulevaisuutesi
Ääniohjattu aikakausi ei ole pelkästään haku. Se vaikuttaa koko tapaan, jolla olemme vuorovaikutuksessa tietokoneiden kanssa. Ei aivan kaukaisessa tulevaisuudessa näppäimistöjä pidetään "viehättävinä", kuten Scotty tunnetusti kuvaili niitä "Star Trek IV: ssä".
Mutta tämä muutos vaatii myös kokonaan uuden käyttöliittymän. Tässä on muinainen esimerkki siitä, mitä tarkoitan: Kun Windows 95 tuli ulos, IBM oli integroinut äänikomennot tietokoneisiinsa. Työskentelin tuolloin myyjänä Office Depotissa, ja kävi nopeasti ilmi, kuinka epäkäytännölliset äänikomennot olivat. Ikkunoitu käyttöliittymä ei sovi lainkaan tähän vuorovaikutuksen muotoon.
Tarkoitan, kuinka helvettissä siirrät ikkunan pois tieltä toiseen ikkunaan ja muutat molempien kokoa, jotta ne mahtuvat tehokkaasti näytölle äänikomennoilla? Et. Ojitat nämä ikkunat (ja luultavasti Windows) kokonaan. Ääniohjattu käyttöliittymä ei käytä samoja motiiveja. Star Trekissä ei koskaan näy ikkunoitua käyttöliittymää.
Kun puhutaan "Star Trekistä", kun ihmiset alkavat koodata tai tehdä jotain teknistä, he siirtyvät aina kosketuskäyttöliittymään (OK, ei aivan kosketusnäyttö - se näyttää enemmän kuin mikroaaltonäppäimistö, joka on peitetty piirilevyn art nouveau -piirroksilla). Mutta onko regressio "kirjoittamiseen" tarpeen? Totta, en voi kuvitella ääniliittymän käyttämistä Scalan koodaamiseen. Ehkä kehitetään uusia kieliä (ilman sulkeita, toisin kuin Scala - ja artikkelini), jotka soveltuvat erityisesti äänelle.
Verkkosivustot eivät varmasti näytä samanlaisilta ja tarjoavat uusia navigointiparadigmia. Sanot "näytä minulle kenkiä koskevat tarjoukset", ja palauttamasi tuotteet ovat todennäköisesti paremmin järjestettyjä ja asiayhteyteen arkaluonteisempia kuin keskimääräinen verkkosivustosi ("tarjoukset" ja "kengät"). En myöskään halua vierittää tai sanoa "seuraava sivu" paljon, joten vuorovaikutukset on räätälöitävä. Järjestelmän pitäisi jo tietää, että haluan miesten kenkiä enkä halua kovakorkoisia kenkiä Achillesin jänteen takia. Ehkä se tietää mieluummin tummat värit. Ehkä kerroin sen tai ehkä se analysoi käyttäytymistäni.
Onko tämä verkkosivusto ollenkaan? Toki, jos ostan kenkiä, haluan visuaalisen esityksen, mutta jos puhun, ehkä kone puhuu takaisin. Ehkä se näyttää minulle kenkiä ja kysyy sitten: "Etsitkö tietyn tyyppistä kenkää? Mihin tarkoitukseen nämä kengät ovat? Käytätkö niitä vaellukselle vai juhliin?"
Äänihaun aikakausi muuttaa kaiken siitä, miten olemme vuorovaikutuksessa koneiden kanssa koodaamiseen. Monet tarvitsemistamme tekniikoista ovat jo käytettävissä tänään, kun taas toisia ei vielä ole keksitty. Vaikutus käyttöliittymiin voisi olla syvempi kuin siirtyminen perfokorteista näppäimistöihin.
Tämä laajamittainen muutos ei tule kerralla. Tänään ei ole päivä heittää näppäimistö. Mutta saattaa olla se päivä, kun alkaa ajatella verkkosivustosi uudistamista siten, että se on todella ääniyhteensopiva.