Tenk på dine favoritt åpne databaser.
Jeg er sikker på at Wikipedia og IMDb umiddelbart kommer i tankene, men du kan ikke være i behov av all den kunnskapen noensinne, eller en omfattende database med alt underholdning. Noen ganger trenger du litt VLDB (Very Large Data Base) smak. Noe å krydre din dataanalyse Hvordan bli en datavitenskap Hvordan bli en datavitenskap Datavitenskap har gått fra en nybegynt periode i 2007 til å være en av de mest etterspurte disipliner i dag. Men hva gjør en datavitenskapsmann? Og hvordan kan du gå inn i feltet? Les mer . Noe å sette den "store" i dine store data. Help, god person, du er på rett sted.
Her er 15 massive nettdatabaser, så hva er en database, uansett? [MakeUseOf Forklarer] Så Hva er en database, uansett? [MakeUseOf Forklarer] For en programmerer eller en teknologientusiast er begrepet en database noe som virkelig kan tas for gitt. Men for mange mennesker er begrepet en database selv litt utenlandsk .... Les mer du kan få tilgang til og analysere gratis Excel Vs. Tilgang - Kan et regneark erstatte en database? Excel Vs. Tilgang - Kan et regneark erstatte en database? Hvilket verktøy bør du bruke til å administrere data? Tilgang og Excel har begge data filtrering, sortering og spørring. Vi viser deg hvilken som passer best for dine behov. Les mer, eller bare lese på fritiden.
1000 genomer
2003-fullførelsen av Human Genome Project (HGP) var bare begynnelsen. Siden da har fremskritt innen sekvenseringsteknologi vesentlig redusert kostnadene per person, noe som tillater stor utvidelse av HGP fra den opprinnelige forskningsbasen av tjue universitetslaboratorier, inn i et viltvoksende, globalisert nettverk av sammenkoblede genomkartingsanlegg.
Du kan laste ned en del av 1000 Genomes Project, som inneholder sekvenseringsinformasjon for over 2600 personer fra 26 befolkninger over hele verden. Dette er en 200TB-fil, så vær forberedt. Vi foreslår at du bruker den sammen med en kraftig cloud computing-plattform.
Se også: Animal Genome Size Database for genomdata relatert til 5635 arter.
passasjerfly
Planespotters himmelen. En massiv bildedatabase med 2.532.457 bilder av alle slags fly, fra den minste individuelle båten til hulking flotte flygende festninger.
Flyselskapene har også et omfattende flydata og historieavsnitt som alltid holdes oppdatert i samarbeid med Aerospace Publications for å sikre faktuell nøyaktighet. Dette har gjort det til en av de mest detaljerte flydatabasene på Internett.
Se også : Prøv Planespotters.net for et annet utvalg av bilder, eller SeatGuru for planleggingsplaner for fly.
Internettarkivet
Siden tidligere kjent som The Internet Archive, har gått gjennom et massivt redesign. Nettstedet hadde ikke endret seg mye siden rundt 2002, men mye har endret seg siden da. Internettarkivet har gjort enda mer voksende siden de tidlige dagene.
Arkiverer alt på Internett, gir nettstedet deg gratis tilgang til digitale medier, inkludert bøker, musikk, spill. Internet Archive bringer 900 Classic Arcade Games til din nettleser. Her er 7 av de beste Internett-arkivet Bringer 900 Classic Arcade Games til din nettleser. Her er 7 av de beste Byens arkade kan ha stengt ned i midten av 90-tallet, men det bør ikke stoppe deg fra å få dine klassiske spillrettinger. Les mer, videoer og mye mer. Samlingen beregnes for tiden på rundt 10 petabytes. Minnestørrelser forklart - Gigabyte, Terabytes og Petabytes i Laymans vilkår. Minnestørrelser forklart - Gigabytes, Terabytes og Petabytes i Laymans vilkår. Det er enkelt å se at 500 GB er mer enn 100 GB. Men hvordan sammenligner forskjellige størrelser? Hva er en gigabyte til en terabyte? Hvor passer en petabyte inn? La oss rydde det opp! Les mer, og som deres webcrawlers fortsetter å krype, vil den fortsette å vokse.
Freebase
Freebase er "en community-curated database av kjente personer, steder og ting", lagret i en datastruktur kalt en graf . En graf består av noder, forbundet med kantene, som tillot Freebase å raskt utvide innholdet uten å forstyrre eksisterende poster.
Dessverre, Freebase, eid av Google, byttet til skrivebeskyttet modus tidlig i år, før den frittstående tjenestedatabasen overføres til Wikimedia Foundation for integrasjon. Prøv ut Beta-funksjoner på Wikimedia og forhåndsvisning Hva er nytt før noen andre, prøv på Beta-funksjoner på Wikimedia og forhåndsvisning Hva er nytt før noen andre Wikimedia's Beta Features-program vil tillate noen å prøve ut de kommende nye funksjonene på Wikimedia og dets wikis. Bli med og bidra til å gjøre Wikimedia til en bedre opplevelse for oss alle. Les mer i Wikidata-prosjektet (slutten av juni 2015). Utviklere kan for tiden fortsatt få tilgang til Freebase ved hjelp av eksisterende APIer, men når bryteren er laget, må utviklerne bruke Wikimedia APIs til å få tilgang til dataene.
Finn en grav
Fra hjemmebasen til et internettkunnskapdrømmeteam av Google og Wikimedia, beveger vi seg til morbid. Find a Grave er en massiv, 121 millioner rekorddatabase over begravelser rundt om i verden.
De mest omfattende dokumentene kommer fra USA, men det er noen mindre land med store data. Komplett med bilder, interessante monumenter, og en rekke interessante epitaphs ... hvis du trenger inspirasjon?
Gamerankings
En database opprettholdt av det nåværende gjeldende teamet på Gamespot. GameRankings gir et godt avrundet skildring av spillets popularitet ved å dekke on-and-offline spillanmeldelser fra anerkjente kilder. 6 Steder for å finne ut hva som er de beste videospillene noensinne 6 Steder for å finne ut hva som er de beste videospillene noensinne Det er bare naturlig for en fan av spill for å lure på hva de beste spillene noensinne har gjort, eller i det minste hva eksperterne mener er de beste. Les mer .
The Big Cartoon Database
I en lignende vei til den massive IMDb fokuserer The Big Cartoon Database utelukkende på alt som er animert: tegneserier, filmer, TV-programmer, annonser og mer. Hvis det er en animasjon, finner du det her - og hvis ikke, registrer deg som bidragsyter til denne stadig voksende databasen.
The Big Cartoon Database har en søsterside i The Big Comic Database, hjemmet til ytterligere 100 000 eller flere tegneserier. 9 Bordspilletemaer Tegneserier Bøker Du bør lese 9 Videospilletemaer Tegneserier Bøker du bør lese Det er på tide å slå av og gå til seng. Men du er fortsatt kløe for å spille ditt favorittspill. Du må slå ned, så hvorfor ikke les favorittspillet ditt i stedet? Les mer, som spenner over 5000 eksemplarer, med over 35 000 deksler. Den inneholder også en omfattende søkefunksjon, inkludert en tegneserieprisguide som angir nåværende videresalgsverdier på ulike graderingsnivåer.
Se også : The Grand Comics Database, en ikke-kommersiell bedrifts database over tegneserier over hele verden.
CiteSeer X
Et uvurderlig verktøy for studenter Opprette bibliografier og fotnote Sitater er enklere med Bookends for Mac Opprette bibliografier og fotnote Sitater er enklere med Bookends for Mac Bookends for Mac utfører praktisk talt forsknings- og sitningsformateringsoppgaver for deg. Les mer og akademikere, CiteSeer X er en offentlig søkemotor og digitalt bibliotek med faglige og vitenskapelige papirer. Det ble ofte inspirert av Google Scholar og Microsoft Academic Search, som ofte betraktet som det første automatiserte referanseindekseringssystemet . Selv om sistnevnte siden har blitt integrert i Bing-søkemotoren.
CiteSeer X fokuserer på indeksering av offentlige vitenskapelige dokumenter. Hvis forskningspapiret ditt er åpent distribuert, har det større sjanse for å vises i søkemotoren. CiteSeer X er et utmerket eksempel på kraften til felles kunnskap som er tilgjengelig for et mye bredere publikum.
Se også : Google Scholar for et annet utvalg av bøker og sitater.
WorldCat
Dessverre ikke en database av hvert kattebilde på Internett. Nå ville det være noe! WorldCat er mye mer nyttig enn det. Referansestedet dokumenterer samlingene av over 72 000 biblioteker rundt om i verden, som dekker 170 land og territorier. Dette er nyttig hvis du forsker i et fremmed land, eller bare har lyst til å lese sjeldne bøker i person.
Den eneste ulempen er oppdateringsmetoden. WorldCat bruker en batchbehandlingsmodell i stedet for at brukerne får tilgang til dataene i sanntid. Så, WorldCat indikerer ikke lånestatusen for katalogiserte bøker, om et bibliotek eier flere kopier av en bok, eller om den aktuelle boken er direkte tilgjengelig for de som ønsker å besøke. Det er fortsatt et veldig nyttig verktøy, spesielt når det brukes sammen med CiteSeer X.
The Simpsons Archive
"Internettets clearinghouse av Simpsons guider, nyheter og informasjon." Jeg kunne ikke ha gjort det bedre selv. Den langvarige fanfavoritten begynte helt tilbake 1994, og fortsetter fortsatt sterk selv uten interaktivt multimedia, om bare å unnslippe Foxs juridiske avdeling.
WinCustomize
Du finner en av de største databasene for tilpasningsverktøy for Windows Slik tilpasser du Windows lydeffekter Slik tilpasser du Windows lydeffekter Du kan få datamaskinen til å lyde som favorittprogrammet ditt, ta opp egne lyder eller slå dem helt av . Her er et krasj kurs om å endre og spille inn lydeffekter for Windows. Les mer her, spenner fra XP til Windows 8.1 10 Windows 8 Startskjermhacker 10 Windows 8 Startskjermhacker Windows beveger seg mot en mer låst ned-retning med Windows 8 og startskjermbildet og "Moderne" app-miljø. Det kan ikke benekte dette - du kan ikke engang sette en tilpasset startskjermbakgrunn uten å installere ... Les mer. Jeg er sikker på at det ikke tar lang tid før Windows 10 å begynne å lage runder. Dens enorme popularitet stammer fra en kombinasjon av krefter. Eier Stardock, subsidierer nettstedet fordi det er lite til ingen annonser. Det drar også fordel av antall personer som traff til nettstedet fra Stardock.
Ultimate Guitar Archive
Ah, en tur ned nostalgibane til en database som minner meg om at jeg aldri skulle være Roger Waters. Faktisk kan jeg fortsatt knapt spille, men det er en annen historie.
Ultimate Guitar Archive, eller bare Ultimate-Guitar (UG), har over 1.500.000 registrerte medlemmer over hele verden, og overvåker en latterlig stor mengde fellesskap innhold. Det er nesten oppsiktsvekkende hvor mye gitarrelatert informasjon er spredt ut fra en enkelt kilde. Samfunnet opprettholder bare ikke en massiv database, de samarbeider også ofte med hverandre for å skape spredte musikkprosjekter.
Planter for en fremtid
Planter for en fremtid dokumenterer økologisk bærekraftig hagebruk. Den har en stor hånd i å spre kunnskap om artens mangfold og betydningen av permakultur. Det som startet som et lite prosjekt i dypet av Cornwall, har langsomt vokst til en verdensomspennende database.
Veksten er noe sakte, og fokuserer i stor grad på permakultur i Storbritannia og EU, men mange av postene kan byttes ut for bestemte steder i USA når du har arten detaljer.
Quandl
Koble opp med dette Excel-tillegget for å behandle og analysere data Koble opp Excel med 10 tillegg til å behandle, analysere og visualisere data som en Pro Power Up Excel med 10 tillegg til å behandle, analysere og visualisere data som en Pro Vanilje Excel er fantastisk, men du kan gjøre det enda sterkere med tillegg. Uansett hvilke data du trenger å behandle, er det sjansene for at noen opprettet en Excel-app for den. Her er et utvalg. Les mer . Den viktigste Quandl-siden fungerer som en databasesøk, og finner databaser fra hele verden som samsvarer med søkeordene dine. Prøv det hvis du trenger litt ekstra data i en hast, eller akkurat som å spille med store datasett (ærlig, hvem gjør det ikke ?!).
Se også : Enigma database søkemotor.
Tiny bilder
Tiny Images datasettet fungerer som en visuell ordbok. Klikk hvor som helst i bildet og et søkeord dukker opp med ekstra informasjon. Du kan også bruke bestemte vilkår for å sile gjennom 80 millioner bilder .
Databasen er en del av et bredere maskinlæringsprosjekt Hvordan intelligent programvare skal endre livet ditt Hvordan intelligent programvare skal endre livet ditt Skynet kommer, og det kommer til å bli utrolig populært. Nye AI-teknologier kommer frem som vil sjanse måten vi leve, leke og jobbe på. Les mer fokusert på å undervise datamaskiner for å "se" og "lese" semantiske felt innenfor bilder.
Bonus Kilde: / r / datasett
"Forsiden av Internett" er et solid hjem for data mining entusiaster over hele verden. Det er subreddits dedikert til maskinlæring, datautvinning, tekst til data og datasett. Hvis du trenger noe spesifikt, gjør en forespørsel. Nye datasett vises hver uke.
Se opp for de interessante datasettene som er lagt ut som immuniseringsnivåer i barnehage og skoler for California.
Bruker du rikdom?
Internett har skapt den enkleste muligheten for enkeltpersoner å komme sammen og konsentrere sin kunnskap i en enkelt database. Vi prøver å dokumentere alt om noe. Noen av disse databasene er til perusing, andre er for å lære Hvordan bruke en Excel-pivottabell for dataanalyse Hvordan bruke en Excel-pivottabell for dataanalyse Pivottabellen er et av de mest kraftfulle verktøyene i Excel 2013-repertoaret. Den brukes ofte til stor dataanalyse. Følg vår trinnvise demonstrasjon for å lære alt om det. Les mer, men vi håper du nyter dem alle.
Hva er dine favorittdatabaser? Er det noen åpne massive referanse kilder jeg burde ha tatt med i denne listen?
Image Credits: nettverksserver via Shutterstock, bibliotek via Shutterstock