Vi snakker hele tiden om datamaskiner som forstår oss. Vi sier at Google "visste" det vi lette etter, eller at Cortana "fikk" det vi sa, men "forståelse" er et veldig vanskelig konsept. Spesielt når det kommer til datamaskiner.
Et felt av beregningsmessig lingvistikk, kalt naturlig språkbehandling (NLP), jobber med dette spesielt tøffe problemet. Det er et fascinerende felt akkurat nå, og når du har en ide om hvordan det fungerer, vil du begynne å se effektene overalt.
Et raskt notat: Denne artikkelen har noen få eksempler på en datamaskin som svarer på tale, som når du spør Siri for noe. Transformasjonen av hørbar tale til et datamaskinforståelig format kalles talegjenkjenning. NLP er ikke opptatt av det (i det minste i den kapasiteten vi diskuterer her). NLP kommer bare inn i spillet når teksten er klar. Begge prosessene er nødvendige for mange applikasjoner, men de er to svært forskjellige problemer.
Definere forståelse
Før vi kommer inn på hvordan datamaskiner håndterer naturlig språk, må vi definere noen få ting.
Først av alt, må vi definere naturlig språk. Dette er en enkel en: hvert språk som brukes regelmessig av mennesker faller inn i denne kategorien. Det inkluderer ikke ting som konstruerte språk (Klingon, Esperanto) eller programmeringssprog. Du bruker naturlig språk når du snakker med vennene dine. Du bruker også det for å snakke med din digitale personlige assistent.
Så hva mener vi når vi sier forståelse? Vel, det er komplekst. Hva betyr det å forstå en setning? Kanskje du vil si at det betyr at du nå har det tilsiktede innholdet i meldingen i hjernen din. Å forstå et konsept kan bety at du kan bruke det konseptet til andre tanker.
Ordliste definisjoner er nebulous. Det er intuitivt svar. Filosoffer har argumentert over slike ting i århundrer.
For vår hensikt skal vi si at forståelse er evnen til å nøyaktig utvinne mening fra naturlig språk . For at en datamaskin skal forstå, må den nøyaktig behandle en innkommende talestrøm, konvertere denne strømmen til meningsenheter, og kunne svare på inngangen med noe som er nyttig.
Tydeligvis er dette alt veldig vett. Men det er det beste vi kan gjøre med begrenset plass (og uten en nevrofilosofi grad). Hvis en datamaskin kan tilby en menneskelig eller, i det minste nyttig, svar på en strøm av naturlig språkinngang, kan vi si det forstår. Dette er definisjonen vi skal bruke fremover.
Et komplekst problem
Naturlig språk er svært vanskelig for en datamaskin å håndtere. Du kan si, "Siri, gi meg retninger til Punch Pizza", mens jeg kanskje sier, "Siri, Punch Pizza rute, vær så snill."
I din uttalelse kan Siri velge keyphrase "gi meg retninger", og kjør en kommando relatert til søkeordet "Punch Pizza." I min må Siri imidlertid velge "rute" som søkeord og vite at " Punch Pizza "er hvor jeg vil gå, ikke" vær så snill. "Og det er bare et forenklet eksempel.
Tenk på en kunstig intelligens som leser e-post og avgjør om de kan være svindel eller ikke. Eller en som overvåker sosiale medier innlegg for å måle interesse for et bestemt selskap. Jeg jobbet en gang i et prosjekt der vi måtte lære en datamaskin å lese medisinske notater (som har alle slags merkelige konvensjoner) og hente informasjon fra dem.
Dette innebærer at systemet måtte håndtere forkortelser, merkelig syntaks, sporadiske feilstavelser og et bredt utvalg av andre forskjeller i notatene. Det er en svært kompleks oppgave som kan være vanskelig selv for erfarne mennesker, mye mindre maskiner.
Angi et eksempel
I dette prosjektet var jeg en del av teamet som lærte datamaskinen til å gjenkjenne bestemte ord og forholdet mellom ord. Det første trinnet i prosessen var å vise datamaskinen informasjonen som hvert notat inneholdt, så vi merket notatene.
Det var et stort antall ulike kategorier av enheter og relasjoner. Ta setningen "Fru. Grønns hodepine ble behandlet med ibuprofen, "for eksempel. Ms Green var merket som en PERSON, hodepine ble merket som SIGN OR SYMPTOM, ibuprofen ble merket som MEDICATION. Så var Ms Green knyttet til hodepine med et PRESENTS-forhold. Endelig var ibuprofen knyttet til hodepine med et behandlingsforhold.
Vi merket tusenvis av notater på denne måten. Vi kodet diagnoser, behandlinger, symptomer, underliggende årsaker, morbiditeter, doseringer og alt annet du muligens kunne tenke på i forbindelse med medisin. Andre annoteringsgrupper kodet annen informasjon, som syntax. Til slutt hadde vi et corpus fullt av medisinske notater som AI kunne "lese".
Lesing er like vanskelig å definere som forståelse. Datamaskinen kan enkelt se at ibuprofen behandler hodepine, men når den lærer den informasjonen, blir den omgjort til meningsløse (til oss) de og nullene. Det kan sikkert gi tilbake informasjon som virker menneskelig og er nyttig, men utgjør det som forstår Hva kunstig intelligens er ikke Hva kunstig intelligens ikke er intelligent, vil sentient roboter overta verden? Ikke i dag - og kanskje aldri. Les mer ? Igjen er det stort sett et filosofisk spørsmål.
Den virkelige læringen
På dette punktet gikk datamaskinen gjennom notatene og brukte en rekke maskinlæringsalgoritmer. 4 Maskininlæringsalgoritmer som lager livet ditt 4 Maskininlæringsalgoritmer som lager livet ditt Du kan ikke skjønne det, men maskinlæring er allerede rundt deg, og det kan utøve en overraskende grad av innflytelse over livet ditt. Tro ikke på meg? Du kan bli overrasket. Les mer . Programmører utviklet forskjellige rutiner for å merke deler av tale, analysere avhengigheter og valgkretser, og merking av semantiske roller. I hovedsak lærte AI å "lese" notatene.
Forskere kan til slutt teste det ved å gi det en medisinsk notat og be om å merke hver enhet og relasjon. Når datamaskinen nøyaktig reproduserte menneskelige kommentarer, kan du si at den lærte å lese de medisinske notatene.
Etter det handlet det bare om å samle en stor mengde statistikk om hva den hadde lest: hvilke stoffer brukes til å behandle hvilke lidelser, hvilke behandlinger som er mest effektive, de underliggende årsakene til bestemte sett med symptomer og så videre. Ved slutten av prosessen vil AI kunne svare på medisinske spørsmål basert på bevis fra faktiske medisinske notater. Det trenger ikke å stole på lærebøker, farmasøytiske selskaper eller intuisjon.
Deep Learning
La oss se på et annet eksempel. Googles DeepMind nevrale nettverk lærer å lese nyhetsartikler. Som det biomedisinske AI ovenfor, ønsket forskerne at det skulle trekke ut relevant og nyttig informasjon fra større tekststykker.
Trening av et AI på medisinsk informasjon var tøft nok, så du kan forestille deg hvor mye annotert data du trenger for å gjøre en AI i stand til å lese generelle nyhetsartikler. Ansette nok annotatorer og gjennomgå nok informasjon ville være uoverkommelig dyrt og tidkrevende.
Så vendte DeepMind-teamet til en annen kilde: nyhetsnettsteder. Spesielt CNN og Daily Mail.
Hvorfor disse nettstedene? Fordi de gir kulepunkta oppsummeringer av deres artikler som ikke bare trekker setninger fra selve artikkelen. Det betyr at AI har noe å lære av. Forskerne fortalte i utgangspunktet AI, "Her er en artikkel og her er den viktigste informasjonen i den." Da ba de om å trekke den samme typen informasjon fra en artikkel uten bulleted høydepunkter.
Dette kompleksitetsnivået kan håndteres av et dypt nevralt nettverk, som er en spesielt komplisert type maskinlæringssystem. (DeepMind-teamet gjør noen fantastiske ting på dette prosjektet. For å få detaljer, sjekk ut denne flotte oversikten fra MIT Technology Review.)
Hva kan en lesing gjøre?
Vi har nå en generell forståelse av hvordan datamaskiner lærer å lese. Du tar en stor mengde tekst, fortell datamaskinen hva som er viktig, og bruk noen maskinlæringsalgoritmer. Men hva kan vi gjøre med en AI som trekker informasjon fra tekst?
Vi vet allerede at du kan trekke spesifikk handlingsinformasjon fra medisinske notater og oppsummere generelle nyhetsartikler. Det er et åpen kildeprogram som heter PAN som analyserer poesi ved å trekke ut temaer og bilder. Forskere bruker ofte maskinlæring til å analysere store organer av sosiale medier, som brukes av bedrifter til å forstå brukerens følelser, se hva folk snakker om, og finne nyttige mønstre for markedsføring.
Forskere har brukt maskinlæring for å få innsikt i e-postadferd og effekter av overbelastning av e-post. E-postleverandører kan bruke den til å filtrere ut spam fra innboksen din og klassifisere noen meldinger som høy prioritet. Reading AIs er avgjørende for å gjøre effektive kundeservice chatbots 8 Bots du bør legge til på Facebook Messenger App 8 Bots du bør legge til Facebook Messenger App Facebook Messenger har åpnet opp for å chatte bots, slik at bedrifter kan levere kundeservice, nyheter og mer direkte til deg via appen. Her er noen av de beste tilgjengelige. Les mer . Overalt er det tekst, det er en forsker som arbeider med naturlig språkbehandling.
Og ettersom denne typen maskinlæring forbedres, øker mulighetene bare. Datamaskiner er bedre enn mennesker på sjakk, gå og videospill nå. Snart kan de være bedre å lese og lære. Er dette det første skrittet mot sterk AI Her er hvorfor forskere tror du burde være bekymret for kunstig intelligens. Her er hvorfor forskere tror du burde være bekymret for kunstig intelligens. Tror du at kunstig intelligens er farlig? Kan AI utgjøre en alvorlig risiko for menneskeheten. Dette er noen grunner til at du kanskje vil være bekymret. Les mer ? Vi må vente og se, men det kan være.
Hvilke bruksområder ser du for en tekstavlesning og læring AI? Hva slags maskinlæring tror du vi vil se i nær fremtid? Del dine tanker i kommentarene nedenfor!
Image Credits: Vasilyev Alexandr / Shutterstock