10 Gratis datavetenskap verktyg och tillämpningar

Visualiseringar är en viktig del av datavetenskapens verktygslåda för stora data. Med dem kan du utnyttja hjärnans förmåga att snabbt absorbera visuell information. Datavisualiseringar är ett mycket effektivt sätt att kommunicera datainsikten.

Gör egna webbaserade datavisualiseringar med gratis R-paket

Dessa paket och verktyg är användbara för att skapa riktigt coola datavisualiseringar, men de kräver att du kodar i R-statistikprogrammeringsspråket för att kunna använda dem.

Bli glänsande av RStudio

Med lanseringen av RStudio's Shiny-paket 2012 kan både statistisk analys och webbaserad datavisualisering utföras i samma ram.

Om ditt mål är att snabbt använda några rader av kod för att direkt skapa ett webbaserat datavisningsprogram, kan du använda Rs Shiny-paket för att göra detta.

Diagram med rCharts

rCharts är ett paket med öppen källkod för R som tar dina data och parametrar som inmatning och konverterar dem sedan snabbt till en JavaScript-kodblockutmatning. Kodblockutgångar från rCharts kan använda en av många populära JavaScript-databasvisningsbibliotek, inklusive NVD3, Highcharts, Richskaw, xCharts, Polychart och Morris.

För att se några exempel på datavisualiseringar skapade med rCharts, kolla in rCharts Gallery.

Kartläggning med rMaps

Med hjälp av rMaps kan du skapa animerade eller interaktiva kloropletter, värmekartor eller till och med kartor med kommenterade platsdroppar.

Om ditt mål är att skapa en geografisk datavisualisering som har interaktiva reglage som användare kan flytta för att välja det dataområde de vill se, ger rMaps dig en perfekt lösning.

Kolla in fler skrap-, samlings- och hanteringsverktyg

Du kan använda webbskrapning för att härleda riktigt intressanta och unika dataset för dina datatrivena historier.

Skrapdata med Importera. io

Import. Io är en gratis skrivbordsapplikation som med några få musklick kan användas för att smärtfritt kopiera, klistra in, rengöra och formatera vilken del av en webbsida som helst. Du kan även använda Importera. Io för att automatiskt krypa och extrahera data från flervalslistor.

Använda Import. Io, du kan skrapa data från en enkel eller komplicerad serie webbsidor:

  • För att skrapa en enkel serie webbsidor, få tillgång till dem via enkla hyperlänkar, i Page 1, Page 2, Page 3, ... series.

  • För att skrapa en komplicerad serie webbsidor fyller du i en blankett eller väljer en drop-down-lista och skickar in din skrapförfrågan till verktyget.

Samla bilder med ImageQuilts

Uppgiften ImageQuilts utför är bedrägligt enkel att beskriva men mycket komplex att implementera. ImageQuilts gör kollagen av tiotals bilder och delar dem ihop i ett "quilt" som består av flera rader med samma höjd.

ImageQuilts tillåter dig även att välja bildordning eller att randomisera dem. Du kan använda verktyget för att dra och släppa någon bild till vilken plats som helst, ta bort en bild, zooma alla bilder samtidigt, eller zooma varje bild individuellt.

Wrangling data med DataWrangler

De typer av manipuleringar du kan göra med DataWrangler liknar vad du kan göra i Excel med Visual Basic. Ett exempel på denna typ av uppgift är att använda DataWrangler eller Excel med Visual Basic för att kopiera, klistra in och formatera information från listor på Internet.

DataWrangler är så bra att det föreslår åtgärder baserat på ditt dataset och kan till och med upprepa komplexa åtgärder över hela dataset.

Kolla in fler datautforskningsverktyg

Visualisering är viktigt för att förtydliga och kommunicera dataens betydelse, men noggrann dataanalys är ännu viktigare.

Tala om Tableau Public

Tableau Public är ett gratis skrivbordsprogram som syftar till att vara ett komplett paket för kartläggning. Tableau Public skapar tre nivåer av dokument:

  • Arbetsblad: Arbetsbladet är där du kan skapa individuella diagram från data du har importerat från Access, Excel eller en CSV-fil med textformat.

  • Dashboard: Du kan använda en Tableau Dashboard för att kombinera diagram med textanmärkningar eller med andra datatabeller.

  • Story: Med en Tableau Story kan du kombinera flera instrumentbrädor i ett slags presentationspresentation som visar en linjär historia i dina data.

Förhöjning i Gephi

Gephi är ett program med öppen källkod som du kan använda för att skapa graflayouter och sedan manipulera dem för att få de mest tydliga och effektiva resultaten. De typer av anslutningsbaserade visualiseringar du kan skapa i Gephi är mycket användbara i alla typer av av nätverksanalyser.

Detta diagram visar vilka tecken som visas i samma kapitel som vilka andra tecken i Victor Hugos enorma roman Les Misérables.

Här är ett hårbollsdiagram över USAs elnät och graden av sammankoppling mellan tusentals kraftproduktion och kraftdistributionsanläggningar.

Maskininlärning med WEKA-sviten

Waikato Environment for Knowledge Analysis (WEKA) är en fristående applikation som du kan använda för att analysera mönster i dina dataset och sedan visualisera dessa mönster på alla möjliga intressanta sätt. För avancerade användare härrör WEKAs verkliga värde från sin serie maskinalarmalgoritmer som du kan använda för att gruppera eller kategorisera dina data.

Kolla in fler webbaserade visualiseringsverktyg

Du kan använda en mängd gratis webbapps för att enkelt skapa unika och intressanta datavisualiseringar.

Få lite väv upp din ärm

Om ditt mål är att skapa visualiseringar som låter din publik se och utforska samspelet mellan deluppsättningar av dina data, är Weave det perfekta verktyget för denna typ av uppgift.

Här är en demovisualisering på Weaves egen server. Den visar varje län i USA, med många kolumner data att välja mellan.

Checka ut Knoemas datavisualiseringserbjudanden

Du kan använda Knoemas data-visualiseringsverktyg för att skapa visualiseringar som gör att publiken enkelt kan utforska data, borra ner på geografiska områden eller olika indikatorer och automatiskt producera datastyrda tidslinjer.

Här är ett diagram och ett bord som genererades automatiskt med bara två musklick i Knoema.

Du kan också använda Knoema för att skapa egna instrumentpaneler.

Du kan skapa instrumentpaneler från dina egna data eller från öppna data i Knoema's repository.