Ohjelmointi

3 Kaggle-vaihtoehdot yhteistyötietotieteelle

Mikä on paras tapa saada hyvä vastaus vaikeaan kysymykseen? Kysy joukolta ihmisiä ja tee siitä kilpailu. Se on jo pitkään ollut Kagglin lähestymistapa datatieteeseen: Muuta vaikeita tehtäviä, kuten keuhkosyövän havaitsemisen tarkentaminen, palkkioita maksaviksi kilpailuiksi, joissa parhaat joukkueet ja parhaat algoritmit voittavat.

Nyt Kaggle liikkuu Googlessa, ja vaikka kaikki merkit viittaavat siihen, että sitä pidetään nykyisin, on järkyttävää sellaisen sivuston pitkän aikavälin näkymistä, jolla on niin omistautunut yhteisö ja omaperäinen lähestymistapa.

Tässä on kolme muuta sivustoa, joilla on samanlainen tehtävä, ellei niitä nimenomaisesti noudateta Kagglen jalanjäljissä. (Huomaa, että jotkut sivustot, kuten CrowdAnalytix, voivat pitää kilpailuissa hyväksyttyjä ratkaisuja vuokratöinä ja siten niiden omaisuutena.)

CrowdAI

Sveitsissä sijaitsevan École Polytechnique Fédérale de Lausannen tuote CrowdAI on avoimen lähdekoodin foorumi avoimen datan haasteiden isännöimiseksi ja oivalluksen saamiseksi siitä, miten kyseiset ongelmat ratkaistiin. Alusta on melko uusi, tähän mennessä on tarjolla vain kuusi haastetta, mutta näistä haasteista johdetut oppaat ovat yksityiskohtaisia ​​ja arvokkaita, ja ne tarjoavat vaiheittaiset menetelmät kyseisen teoksen toistamiseksi tai jotain samanlaisen luomiseksi. Nykyiset harjoitukset kattavat yhteiset kehykset, kuten Torch tai TensorFlow, joten se on hyvä paikka hankkia käytännön yksityiskohtia niiden käytöstä.

DrivenData

DrivenData, jonka on luonut ammattimaisiin dataongelmiin erikoistunut konsulttiyritys, isännöi muutaman kuukauden kestäviä online-haasteita. Jokainen keskittyy erityisesti maailman suurimpiin ongelmiin, kuten sairauksien leviämisen ennustamiseen tai Yelp-tietojen louhimiseen ravintolan tarkastusprosessien parantamiseksi. Kuten Kaggle, DrivenDatalla on myös tietojenkäsittelytietojen luettelo - ominaisuus, josta ihmiset ovat huolissaan, saattaa kadota Kaggle-hankinnan jälkeen.

JoukkoAnalytix

Accel Partnersin ja SAIF Partnersin sijoittajien tukemana CrowdAnalytix keskittyy datapohjaisten ongelmanratkaisukilpailujen isännöintiin sen sijaan, että jakaisi niistä saatuja tietoja. Kilpailuja tarjotaan ratkaisujen löytämiseksi luokkiin, kuten mallinnus, visualisointi ja tutkimus, ja jokaisella on tuhansia dollareita. Joitakin aikaisempia haasteita ovat työntekijöiden korvausvaatimusten tai lentoyhtiön viivästysten todellisten kustannusten ennustaminen. Muita kilpailuja ei kuitenkaan järjestetä rahalle, vaan kilpailukykyisen vaihtoehdon tarjoamiseksi siihen liittyvän kurin, kuten R-kielen, oppimiseksi.