Android

Google istraživač cilja strukturirane podatke weba

Privacy, Security, Society - Computer Science for Business Leaders 2016

Privacy, Security, Society - Computer Science for Business Leaders 2016
Anonim

"Postoji mnogo strukturiranih podataka na webu, a mi smo ne čineći dobar posao predstavljanja našim korisnicima ", rekao je Alon Halevy tijekom razgovora na konferenciji Dana baze podataka u Novoj Engleskoj na Massachusetts Institute of Technology, Halevy se dijelom odnosio na takozvane" duboke web "izvore, kao što su baze podataka koje se nalaze iza web stranica kao što su Cars.com ili Realtor.com. Google već neko vrijeme šalje upite u razne oblike, dohvaća rezultirajuće web stranice i uključuje ih u svoj indeks pretraživanja ako se informacije čine korisnima.

[Više čitanje: Najbolje usluge streaminga TV-a]

Ali tvrtka također želi analizirati podatke pronađene u strukturiranim tablicama na mnogim web stranicama, rekao je Halevy, koji kao primjer predstavlja tablicu na web stranici koja navodi predsjednike SAD-a.

I postoje tablice tih tablica - Googleov indeks se pojavio 14 milijardu od njih, prema Halevy. On je "vrlo brzo shvatio da više od 98 posto nije zanimljivo", ali čak i nakon značajnog filtriranja ostalo je oko 154 milijuna tablica s indeksiranjem.

Jedan od Googleovih konačnih ciljeva jest pružiti rezultate koji organiziraju "aspekte "upit za pretraživanje, osobito istraživački poput" Putovanja u Vijetnamu ", za razliku od upita za određenu činjenicu kao što je" stanovništvo u Vijetnamu ", rekao je Halevy. Prethodni upit donosi informacije o zahtjevima za vizu, vremenskim i paketima turneje, na primjer.

Ideja ima odjek službe za pretraživanje koju nudi Kosmix, no Google želi ići dalje, prema Halevyju. "Kosmix će vam dati" aspekt ", ali je povezan s izvorom informacija", rekao je.

Pretraživanje "Putovanja u Vijetnamu" na Kosmixu daje organizirani skup rezultata uključujući recenzije restorana iz New York Timesa, slike iz Yahoo i Flickr, informacije o kupovini iz Shopping.com i općeniti web rezultati Googlea.

"U našem slučaju, svi aspekti mogu biti samo rezultati pretraživanja weba, ali ih smo organizirali drugačije", rekao je Halevy.