Primjene tehnologije obrade prirodnog jezika

Kako će NLP oblikovati budućnost tehnološkog sveta?

Obrada prirodnih jezika ili NLP je grana veštačke inteligencije koja ima mnogo važnih implikacija na način na koji računari i ljudi interaguju. Ljudski jezik, razvijen hiljadama i hiljadama godina, postao je nijansiran oblik komunikacije koji nosi bogatstvo informacija koje često prevazilaze same reči. NLP će postati važna tehnologija u premošćavanju jaza između ljudske komunikacije i digitalnih podataka. Evo 5 načina na koji će obrada prirodnog jezika biti korištena u narednim godinama.

01 od 05

Mašinski prevod

Liam Norris / Stone / Getty Images

Kako su informacije na svijetu online, zadatak da se ti podaci postanu pristupačniji postaje sve važniji. Izazov da su informacije na svetu dostupne svima, preko jezičkih barijera, jednostavno prevazilaze kapacitet za ljudski prevod. Inovativne kompanije kao što su Duolingo žele da regrutuju velike količine ljudi kako bi doprinele, poklapajući napore prevođenja s učenjem novog jezika. Ali mašinski prevođenje nudi još više skalabilnu alternativu usklađivanju informacija na svijetu. Google je kompanija na čelu mašinskog prevođenja, koristeći vlasnički statistički mehanizam za svoju uslugu Google prevoda. Izazov sa tehnologijama mašinskog prevođenja nije u prevodu reči, već u očuvanju značenja rečenica, složenog tehnološkog problema koji je u srcu NLP-a.

02 od 05

Borba protiv Spama

Spam filteri su postali važni kao prva linija odbrane od sve većeg problema neželjenog e-pošte. Međutim, skoro svi koji koriste e-poštu opširno su doživeli agoniju zbog neželjenih e-pošte koje su još uvek primljene, ili važnih e-pošta koje su slučajno uhvaćene u filteru. Lažno-pozitivna i lažno-negativna pitanja filtera za neželjene pošte su u srcu NLP tehnologije, koja se opet svode na izazov za uklanjanje značenja iz žica teksta. Tehnologija koja je dobila veliku pažnju je Bayesian filtriranje neželjenih poruka, statistička tehnika u kojoj se incidencija reči u e-pošti mjeri u odnosu na njegovu tipičnu pojavu u korpusu neželjene pošte i ne-spam.

03 od 05

Information Extraction

Mnoge važne odluke na finansijskim tržištima sve više odstupaju od ljudskog nadzora i kontrole. Algoritamska trgovina postaje sve popularnija, oblik finansijskog ulaganja koji je u potpunosti kontrolisan tehnologijom. Međutim, mnoge od ovih finansijskih odluka utiču vijesti, novinarstvo koje je i dalje prezentovano pretežno na engleskom. Jedan od glavnih zadataka NLP-a jeste da uzimaju ove obične tekstualne napise i izvlače relevantne informacije u formatu koji se može uvesti u algoritamske trgovačke odluke. Na primer, vesti o spajanju između kompanija mogu imati veliki uticaj na odluke o trgovanju i brzinu kojom se pojedinosti o spajanju, igračima, cijenama, koji stiču ko, mogu biti ugrađeni u algoritam trgovanja mogu imati implikacije na profit milione dolara.

04 od 05

Sumiranje

Preopterećenost informacija je stvarni fenomen u našem digitalnom dobu, a već nam pristup znanja i informacija daleko prevazilazi našu sposobnost da je razumemo. Ovo je trend koji ne pokazuje znake usporavanja, pa se postaje sve važnija mogućnost smanjivanja značaja dokumenata i informacija. Ovo je važno ne samo što nam omogućava da prepoznamo i apsorbujemo relevantne informacije iz ogromnih količina podataka. Još jedan željeni ishod je razumevanje dubljeg emocionalnog značenja, na primer, na osnovu agregiranih podataka iz društvenih medija , može li kompanija odrediti opšte osećanje za svoju najnoviju ponudu proizvoda? Ova grana NLP-a postaće sve korisnija kao vrijedna marketinška prednost.

05 od 05

Odgovor na pitanje

Pretraživači stavljaju na raspolaganje bogatstvo informacija na svetu, ali su i dalje prilično primitivni kada se radi o konkretnim pitanjima koja postavljaju ljudi. Google je vidio frustraciju koja je to prouzrokovala kod korisnika, koji često treba da isprobaju niz različitih rezultata pretraživanja kako bi pronašli odgovor koji traže. Veliki fokus Google-ovih napora u NLP-u bio je da prepoznaju pitanja o prirodnom jeziku, izvlače značenje i daju odgovor, a evolucija stranice Google rezultata pokazala je ovaj fokus. Iako sigurno se poboljšava, ovo ostaje veliki izazov za pretraživače i jedna od glavnih aplikacija istraživanja prirodnog jezika.