Pythonin data-analyysikirjasto Pandas on vihdoin saavuttanut 1.0-julkaisuehdokkaan. Pandas 1.0 poistaa paljon vanhentuneita toimintoja ja vaatii Python 3.6: n tai uudemman.
Pandat on luotu työskentelemään helposti strukturoiduissa muodoissa, kuten taulukot, matriisit ja aikasarjatiedot. Pandas peittää suuren osan R: n datakehysten toiminnallisuudesta ja toimii hyvin muiden Python-maailman tieteellisten tietokonekirjastojen kanssa.
Pandas 1.0: n avulla Pandan luojat esittävät joukon murtavia muutoksia, jotka ovat olleet töissä jo jonkin aikaa. Tässä on luettelo merkittävimmistä ja miten käsitellä niitä eteenpäin.
Pandas vaatii Python 3.6.1: n tai uudemman
Suurin muutos Pandas 1.0: ssa on tuen pudottaminen kaikille Pythonin versioille, jotka ovat aikaisempia kuin Python 3.6.1. Pandas hylkäsi tuen Python 2: lle ja sitoutui yksinomaan Python 3: een vuodesta 2019 lähtien, joten tämä on lähinnä nykyisen käytännön tarkennusta.
Projektilla on myös uusi tukikäytäntö Pandan tuleville versioille. Python-version tuen pudotus otetaan käyttöön uusissa Pandan uusissa versioissa (2.0, 3.0 jne.). Pienet versiot vanhentavat ominaisuuksia, mutta eivät poista niitä. suuret julkaisut poistavat ominaisuuksia.
Pandan uusi NA-arvo
Aikaisemmissa Pandas-versioissa puuttuvien tietojen esittämiseen käytettiin erilaisia tyyppejä säilön tyypistä riippuen - yksi päivämäärätyypeille, toinen esineille jne. Kaikki nämä yhdistetään yhdeksi puuttuvan datan tyypiksi, nimeltään NA. Tällä hetkellä NA: n tuki on rajoitettu muutamaan objektityyppiin, ja sitä pidetään kokeellisena, joten sitä ei pitäisi vielä käyttää tuotannossa.
API-yhteensopimattomuudet
Jotkut Pandan sovellusliittymät ovat nyt taaksepäin yhteensopimattomia Pandas 1.0: n muutosten vuoksi. Tämä sisältää muutoksia useiden yleisten elementtien käyttäytymiseen:
-
Datakehys
tyyppi pandas.array
taulukot.IntegerArray
Monet näistä yhteensopimattomuuksista herättävät varoituksia, mutta on parasta testata olemassa olevat Pandas-skriptit rinnakkain Pandas 1.0-kollegoidensa kanssa nähdäksesi, miten ne toimivat.
Pandas 1.0: n vanhentuneet ominaisuudet
Pandan dokumentaatiossa luetellaan kaikki ominaisuudet, jotka poistetaan käytöstä, mutta joita ei tarvitse poistaa Pandas 1.0: sta. Jotkut niistä on yksinkertaisesti nimetty uudelleen tai järjestetty uudelleen, kuten testausmoduuli, kun taas toiset muuttavat tiettyjen toimintoparametrien käyttöä. Muutamassa tapauksessa, kuten kanssa Sarja.tuote ()
ja Hakemisto.tuote ()
, ominaisuudet on vapautettu käytöstä poistamisesta ja ovat edelleen käytettävissä.
Jos käytät Pandas-versiota aikaisemmin kuin 0.25, Pandan luojat suosittelevat siirtymistä Pandas 0.25 -versioonensimmäinen, varmistaen, että kaikki Panda-riippuvainen koodi toimii odotetulla tavalla,sitten siirtyminen Pandas 1.0: een. Tällä varmistetaan, että kaikki vanhentuneita toimintoja käyttävät koodit merkitään.
Pandas 1.0: sta poistetut ominaisuudet
Jotkut Pandan tärkeimmistä ominaisuuksista on poistettu kokonaan Pandas 1.0: sta:
Harvinainen sarja
jaSparseDataFrame
. KäyttääSarja
taiDatakehys
kanssaharvat arvot
vaihtoehto.- Matplotlib-yksikön rekisteröinti. Tämä estää Matplotlibin vaikutuksen tuodessasi Pandoja.
- Monet muut aiemmin vanhentuneet ominaisuudet.
Tämä on jälleen yksi syy testata Pandas 1.0 -julkaisukandidaatti rinnakkain nykyisen Pandas-asennuksesi kanssa ja varmistaa, että skriptisi käyttäytyvät tarkoitetulla tavalla.
Pandas 1.0: n asentaminen
Pandas 1.0 voidaan asentaa suoraan Pythoniin Pip-paketinhallinnan avulla kirjoittamalla pip asentaa pandat
. Pandas 1.0 on saatavana myös osana Anaconda Python -jakelua tieteelliseen laskentaan.
Kaikissa tapauksissa on parasta asentaa Pandas virtuaaliseen ympäristöön, varsinkin jos haluat suorittaa Pandas 1.0 -skriptien testit rinnakkain aiemman version vastaavien kanssa.