05.01.2015 Views

(Microsoft PowerPoint - Cibermetr\355a2.ppt) - E-LIS

(Microsoft PowerPoint - Cibermetr\355a2.ppt) - E-LIS

(Microsoft PowerPoint - Cibermetr\355a2.ppt) - E-LIS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Subdominios y páginas personales<br />

Yahoo Search<br />

Comando feature:<br />

<br />

feature:index<br />

feature:homepage (sitios con ~)<br />

<br />

feature:homepage feature:index<br />

Errores<br />

<br />

<br />

GoogSpy<br />

Respuestas no subdominios<br />

Respuestas duplicadas<br />

Términos en dominios/subdominios<br />

1


Subdominios<br />

2


GoogSpy<br />

3


Ficheros ricos y ficheros media<br />

Ficheros ricos<br />

<br />

<br />

Definición y tipos<br />

<br />

<br />

Adobe Acrobat (pdf) y Postscript (ps)<br />

MS Office: Word (doc, rtf), Excel (xls), Powerpoint (ppt)<br />

Tamaño: Google y Yahoo<br />

<br />

Delimitadores: filetype (Google); originurlextension (Yahoo)<br />

Ficheros media<br />

<br />

<br />

Definición y tipos<br />

FilExt www.filext.com<br />

Localización en motores<br />

<br />

<br />

<br />

Términos<br />

Delimitadores<br />

Bases de datos autónomas<br />

4


Google (filetype)<br />

5


Google (filetype)<br />

Tipos 11-nov-01 24-may-02 01-oct-02 29-mar-04 Tipos 11-nov-01 24-may-02 01-oct-02 29-mar-04<br />

html, htm 63.600.000 98.800.000 120.700.000 240.000.000 ps 523.000 635.000 665.000 2.020.000<br />

asp, aspx, dsp, jsp 12.120.000 23.900.000 31.156.700 78.260.100 xls 297.000 443.000 506.000 1.420.000<br />

php, php3, php4 8.524.000 17.964.000 24.602.000 70.470.000 exe 287.000 393.000 693.000 1.360.000<br />

pdf 3.990.000 6.310.000 7.410.000 22.000.000 ppt 257.000 419.000 442.000 1.170.000<br />

cgi 4.350.000 7.500.000 8.060.000 19.200.000 stm 290.000 479.000 440.000 1.130.000<br />

shtm, shtml 4.328.000 7.419.000 8.502.000 17.221.000 rtf 225.000 336.000 341.000 856.000<br />

cfm 2.950.000 5.340.000 6.730.000 15.500.000 lasso 101.000 474.000<br />

c, cc, cpp, cxx,<br />

inc, java, pas, pl,<br />

sh, tcl, bat<br />

Google: Composición y evolución de tipos de ficheros<br />

py 662.000 396.000<br />

1.480.000 2.380.000 4.765.600 11.723.300<br />

gsp 214.000 154.000 307.000<br />

phtml, phtm 2.180.400 6.159.900 bmp, gif, jpg, png 9.070 19.610 163.000 187.270<br />

fcgi 103.000 6.000.000 htx 124.000 156.000<br />

doc 1.160.000 1.820.000 2.140.000 5.750.000 dwg 102.000 144.000<br />

txt, text, csv 1.650.000 2.700.000 3.067.200 5.511.000 wml 133.000 139.000<br />

swf 2.520.000 5.200.000 rdf 83.200 175.000 125.000 106.000<br />

jhtml, jhtm 247.026 493.650 1.085.500 3.412.400 zip, gz, bz2 862 819 162.800 103.150<br />

xml, xhtml, xsl, dtd 282.400 644.600 742.300 2.022.100 class, jar 319.500 56.000<br />

6


Exalead (filetype)<br />

7


FilExt<br />

8


Imágenes en Google<br />

9


Idiomas en la red<br />

Fuentes y estudios<br />

Usuarios según idioma<br />

Global Reach global-reach.biz/globstats/index.php3<br />

Composición del webespacio<br />

Experimentos con buscadores<br />

Google<br />

Yahoo!<br />

MSN Search<br />

Ask<br />

Copernic<br />

10


Usuarios según idioma<br />

http://www.glreach.com/globstats/index.php3<br />

11


Idiomas en la red<br />

Idiomas utilizados para acceder a Google<br />

www.google.com/press/zeitgeist.html<br />

12


Idiomas (Google)<br />

value<br />

Idioma Código Idioma Código<br />

Arabic lang_ar Icelandic lang_is<br />

Chinese (S) lang_zh-CN Italian lang_it<br />

Chinese (T) lang_zh-TW Language Japanese lang_ja<br />

Czech lang_cs Korean lang_ko<br />

Danish lang_da Language Latvian lang_lv<br />

Dutch lang_nl Lithuanian lang_lt<br />

English lang_en Norwegian lang_no<br />

Estonian lang_et Portuguese lang_pt<br />

Finnish lang_fi Polish lang_pl<br />

French lang_fr Romanian lang_ro<br />

German lang_de Russian lang_ru<br />

Greek lang_el Spanish lang_es<br />

Hebrew lang_iw Swedish lang_sv<br />

Hungarian lang_hu Turkish lang_tr<br />

13


Idiomas<br />

Language<br />

value<br />

Language<br />

Google, Enero 2006<br />

14


Países (Google)<br />

Andorra AD Bhutan BT Estonia EE Guinea-Bissau GW Kazakhstan KZ<br />

United Arab Emirates AE Bouvet Island BV Egypt EG Guyana GY Lao PDR LA<br />

Afghanistan AF Botswana BW Western Sahara EH Hong Kong HK Lebanon LB<br />

Antigua and Barbuda AG Belarus BY Eritrea ER Heard and Mc Donald Islands HM Saint Lucia LC<br />

Anguilla AI Belize BZ Spain ES Honduras HN Liechtenstein LI<br />

Albania AL Canada CA Ethiopia ET Croatia (Hrvatska) HR Sri Lanka LK<br />

Armenia AM Cocos (Keeling) Islands CC European Union EU Haiti HT Liberia LR<br />

Netherlands Antilles AN Congo, DR CD Finland Language FI Hungary HU Lesotho LS<br />

Angola AO Central African Republic CF Fiji FJ Indonesia ID Lithuania LT<br />

Antarctica AQ Congo CG Falkland Islands (Malvinas) FK Ireland IE Luxembourg LU<br />

Argentina AR Switzerland CH Micronesia, FS FM Israel IL Latvia LV<br />

American Samoa AS Cote D'ivoire CI Faroe Islands Language FO India IN Libya LY<br />

Austria AT Cook Islands CK France FR British Indian Ocean Terr. IO Morocco MA<br />

Australia AU Chile CL France, Metropolitan FX Iraq IQ Monaco MC<br />

Aruba AW Cameroon CM Gabon GA Iran IR Moldova MD<br />

Azerbaijan AZ China CN United Kingdom UK Iceland IS Madagascar MG<br />

Bosnia and Herzegowina BA Colombia CO Grenada GD Italy IT Marshall Islands MH<br />

Barbados BB Costa Rica CR Georgia GE Jamaica JM Macedonia, FYR MK<br />

Bangladesh BD Cuba CU French Quiana GF Jordan JO Mali ML<br />

Belgium BE Cape Verde CV Ghana GH Japan JP Myanmar MM<br />

Burkina Faso BF Christmas Island CX Gibraltar GI Kenya KE Mongolia MN<br />

Bulgaria BG Cyprus CY Greenland GL Kyrgyzstan KG Macau MO<br />

Bahrain BH Czech Republic CZ Gambia GM Cambodia KH Northern Mariana Islands MP<br />

Burundi BI Germany DE Guinea GN Kiribati KI Martinique MQ<br />

Benin BJ Djibouti DJ Guadeloupe GP Comoros KM Mauritania MR<br />

Bermuda BM Denmark DK Equatorial Guinea GQ Saint Kitts and Nevis KN Montserrat MS<br />

Brunei Darussalam BN Dominica DM Greece GR Korea, DPR KP Malta MT<br />

Bolivia BO Dominican Republic DO South Georgia/South Sandwich I. GS Korea, Republic of KR Mauritius MU<br />

Brazil BR Algeria DZ Guatemala GT Kuwait KW Maldives MV<br />

Bahamas BS Ecuador EC Guam GU Cayman Islands KY Malawi MW<br />

15


Países II (Google)<br />

Mexico MX Qatar QA Tokelau TK<br />

Malaysia MY Reunion RE Turkmenistan TM<br />

Mozambique MZ Romania RO Tunisia TN<br />

Namibia NA Russian Federation RU Tonga TO<br />

New Caledonia NC Rwanda RW East Timor TP<br />

Niger NE Saudi Arabia SA Turkey TR<br />

Norfolk Island NF Solomon Islands SB Trinidad and Tobago TT<br />

Nigeria NG Seychelles SC Tuvalu TV<br />

Nicaragua NI Sudan SD Taiwan TW<br />

Language<br />

Netherlands NL Sweden SE Tanzania TZ<br />

Norway NO Singapore SG Ukraine UA<br />

Nepal NP St. Helena SH Uganda UG<br />

Nauru NR Slovenia<br />

Language<br />

SI United States Minor Outlying I. UM<br />

Niue NU Svalbard and Jan Mayen Is. SJ United States US<br />

New Zealand NZ Slovakia (Slovak Republic) SK Uruguay UY<br />

Oman OM Sierra Leone SL Uzbekistan UZ<br />

Panama PA San Marino SM Holy See (Vatican City State) VA<br />

Peru PE Senegal SN Saint Vincent and the Grenadines VC<br />

French Polynesia PF Somalia SO Venezuela VE<br />

Papua New Guinea PG Suriname SR Virgin Islands (British) VG<br />

Philippines PH Sao Tome and Principe ST Virgin Islands (U.S.) VI<br />

Pakistan PK El Salvador SV Vietnam VN<br />

Poland PL Syria SY Vanuatu VU<br />

St. Pierre and Miquelon PM Swaziland SZ Wallis and Futuna Islands WF<br />

Pitcairn PN Turks and Caicos Islands TC Samoa WS<br />

Puerto Rico PR Chad TD Yemen YE<br />

Palestine PS French Southern Territories TF Mayotte YT<br />

Portugal PT Togo TG Yugoslavia YU<br />

Palau PW Thailand TH South Africa ZA<br />

Paraguay PY Tajikistan TJ Zambia ZM<br />

16


Listados de universidades<br />

Braintrack<br />

Universities Worldwide<br />

Galilei<br />

HEIR<br />

General Education Online<br />

International Colleges and Universities<br />

Portal Tecnociencia<br />

Universia<br />

Canadian Universities<br />

U.S. Universities by State<br />

Top American Reseach Universities<br />

UK Higher Education Map<br />

Times World Universities Rankings<br />

German University Ranking<br />

Academic Ranking of World Universities<br />

All Universities around the World<br />

Ranking of China Universities<br />

Alphabetical Index of Japanese Universities<br />

Language<br />

Language<br />

www.braintrack.com<br />

univ.cc<br />

www.galilei.com.ar<br />

siu.no/heir<br />

www.findaschool.org<br />

www.4icu.org<br />

www.tecnociencia.es<br />

www.universia.es<br />

www.uwaterloo.ca/canu<br />

www.utexas.edu/world/univ/state<br />

thecenter.ufl.edu<br />

www.scit.wlv.ac.uk/ukinfo/uk.map.html<br />

www.thes.co.uk/worldrankings<br />

www.university-ranking.org<br />

ed.sjtu.edu.cn/ranking.htm<br />

www.bulter.nl/universities<br />

rank2005.netbig.com<br />

camp.ff.tku.ac.jp/TOOL-BOX/JapanUNIV<br />

17


Internet invisible<br />

Características<br />

Tamaño y Calidad<br />

Fuentes<br />

Complete Planet www.completeplanet.com<br />

Internet Invisible www.internetinvisible.com<br />

Descripción<br />

Identificación<br />

<br />

<br />

<br />

Institución<br />

País/Idioma<br />

Temática<br />

Cuantitativa<br />

<br />

<br />

Tamaño<br />

Visibilidad<br />

Cualitativa<br />

Estructura<br />

Cobertura<br />

Actualización<br />

Recuperación<br />

18


Agentes personales (I)<br />

<br />

Volcadores<br />

AaronWebVacuum 2.5<br />

JOC WebSpider 3.72<br />

Teleport Pro 1.41<br />

Leech 4.3<br />

WebCopier 4.2<br />

BlackWidow 4.4<br />

MemoWeb 4.0<br />

Offline Commander 2.1<br />

WebReaper 9.8<br />

Offline Explorer Pro 3.9<br />

PowerSiphon 1.9<br />

Website Extractor 9.08<br />

WebWhacker 2000 5.0<br />

WebZip 7.0<br />

www.surfwarelabs.com<br />

www.jocsoft.com<br />

www.tenmax.com<br />

www.aeria.com<br />

www.maximumsoft.com<br />

www.softbytelabs.com<br />

www.goto.fr<br />

www.zylox.com<br />

www.webreaper.net<br />

www.metaproducts.com<br />

www.powersiphon.com<br />

www.asona.org<br />

www.bluesquirrel.com<br />

www.spidersoft.com<br />

19


Agentes personales (II)<br />

Inspectores de enlaces<br />

Alert LinkRunner 6.0<br />

www.alertbookmarks.com/lr<br />

HTML Link Validator 4.4 www.lithopssoft.com<br />

HTML Validator Professional 7.0 www.htmlvalidator.com<br />

Link Checker Pro 3.3<br />

www.kyosoft.com<br />

LinkScan Workstation 11.5 www.elsop.com<br />

Web Link Validator 4.0 www.relsoftware.com/wlv<br />

Xenu's Link Sleuth 1.2 home.snafu.de/tilman/xenulink.html<br />

20


Agentes personales (III)<br />

Extractores HTML<br />

WebData Extractor 4.3 www.webextractor.com<br />

Experimentos<br />

Volcado de sede con el volcador Teleport Pro<br />

Mapeado de la sede volcada con Xenu<br />

<br />

Inspección de links<br />

Mapeado directo de la sede con Xenu<br />

<br />

Inspección de links<br />

Tamaño de la sede según los motores de búsqueda<br />

<br />

Google, Yahoo, Teoma, Gigablast<br />

21


WebDataExtractor<br />

22


Volcado, inspección y mapeado<br />

23


Cibermetria de motores de búsqueda<br />

Motores de búsqueda: Características y<br />

problemática<br />

7 grandes motores “distintos”<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

Google<br />

Yahoo Search<br />

MSN Search (A9 “candidato”)<br />

Ask (ex-Teoma)<br />

Exalead (futuro Quaero)<br />

Wisenut<br />

Gigablast<br />

Estudios sobre motores<br />

Search Engine Showdown<br />

Search Engine Watch<br />

searchengineshowdown.com<br />

searchenginewatch.com<br />

24


¿Sólo siete (+uno)<br />

2003 2004-2005 2006-2007<br />

Sede Base de datos Sede Base de datos Sede Base de datos<br />

GOOGLE GOOGLE GOOGLE<br />

NETSCAPE GOOGLE NETSCAPE GOOGLE<br />

NETSCAPE<br />

GOOGLE<br />

YAHOO YAHOO YAHOO<br />

ALTAVISTA ALTAVISTA ALTAVISTA YAHOO<br />

ALTAVISTA YAHOO<br />

ALLTHEWEB ALLTHEWEB ALLTHEWEB<br />

FAST<br />

LYCOS LYCOS TEOMA LYCOS<br />

IWON GOOGLE IWON GOOGLE IWON ASK<br />

HOTBOT<br />

HOTBOT<br />

INKTOMI<br />

MSN SEARCH MSN SEARCHMSN SEARCH LIVE LIVE<br />

TEOMA<br />

TEOMA<br />

TEOMA<br />

TEOMA<br />

ASK JEEVES<br />

ASK JEEVES<br />

ASK ASK<br />

ALEXA GOOGLE ALEXA ALEXA ALEXA<br />

GOOGLE/MSN SEARCH<br />

A9 A9 LIVE<br />

EXALEAD EXALEAD EXALEAD EXALEAD<br />

WISENUT WISENUT WISENUT WISENUT WISENUT WISENUT<br />

GIGABLAST GIGABLAST GIGABLAST GIGABLAST<br />

GIGABLAST<br />

HEREUARE<br />

GIGABLAST<br />

25


Cibermetria de motores de búsqueda<br />

26


Delimitadores (I)<br />

MOTORES DE<br />

DOMINIO<br />

BUSQUEDA<br />

AGO'05 AGO'06<br />

GOOGLE site:es 11.500.000 138.000.000<br />

MSN SEARCH site:es 18.137.099 16.710.809<br />

YAHOO SEARCH site:es 117.000.000 70.400.000<br />

ASK<br />

site:es<br />

+inurl:es<br />

49.130.000 32.150.000<br />

EXALEAD site:es 3.160.589 10.823.751<br />

GIGABLAST site:es 1.288.876<br />

MOTORES DE<br />

SUBDOMINIO / SITIO<br />

BUSQUEDA<br />

AGO'05 AGO'06 AGO'05 AGO'06<br />

GOOGLE site:csic.es 346.000 3.320.000 site:www.cindoc.csic.es 4.590 21.700<br />

MSN SEARCH site:csic.es 117.099 153.363 site:www.cindoc.csic.es 2.647 2.174<br />

YAHOO SEARCH site:csic.es 199.000 272.000 site:www.cindoc.csic.es 2.430 3.930<br />

ASK<br />

site:csic.es<br />

256.100 129.500 site:www.cindoc.csic.es<br />

+inurl:csic.es<br />

+inurl:www.cindoc.csic.es<br />

3.270 3.520<br />

EXALEAD site:csic.es 19.978 46.150 site:www.cindoc.csic.es 901 1.243<br />

GIGABLAST site:csic.es 15.916 13.764 site:www.cindoc.csic.es 500 455<br />

27


Resultados aproximados<br />

28


Google Data Centers<br />

http://www.mcdar.net/dance/index.php<br />

29


http://www.webrankinfo.com/english/tools/google-data-centers.php<br />

30


Delimitadores (II)<br />

MOTORES DE<br />

BUSQUEDA<br />

SUBDIRECTORIO<br />

AGO'05 AGO'06<br />

AGO'05 AGO'06<br />

GOOGLE site:www.csic.es/cbic 8.050 29.700 site:www.cindoc.csic.es/cybermetrics 249 9.540<br />

MSN SEARCH site:www.csic.es/cbic 1.926 2.228 site:www.cindoc.csic.es/cybermetrics 643 342<br />

ASK inurl:www.csic.es/cbic 3.650 2.290 inurl:www.cindoc.csic.es/cybermetrics 1.890 2.290<br />

EXALEAD site:www.csic.es/cbic 619 914 site:www.cindoc.csic.es/cybermetrics 217 183<br />

MOTORES DE<br />

PALABRA EN URL<br />

BUSQUEDA<br />

AGO'05 AGO'06<br />

GOOGLE inurl:cybermetrics 702 14.700<br />

MSN SEARCH inurl:cybermetrics 0 0<br />

YAHOO SEARCH inurl:cybermetrics 1.920 3.620<br />

ASK inurl:cybermetrics 2.050 1.250<br />

EXALEAD inurl:cybermetrics 977<br />

GIGABLAST suburl:cybermetrics 536 496<br />

31


Delimitadores (III)<br />

MOTORES DE<br />

ENLACE A DOMINIO / SITIO<br />

BUSQUEDA<br />

AGO'05 AGO'06<br />

MSN SEARCH linkdomain:csic.es 205.127 229.310<br />

YAHOO SEARCH linkdomain:csic.es 152.000 245.000<br />

EXALEAD link:csic.es 26.637 24.941<br />

AGO'05 AGO'06<br />

MSN SEARCH linkdomain:cindoc.csic.es 36.608 45.184<br />

YAHOO SEARCH linkdomain:cindoc.csic.es 19.000 26.400<br />

EXALEAD link:cindoc.csic.es 2.133 2.785<br />

AGO'05 AGO'06<br />

MSN SEARCH linkdomain:www.cindoc.csic.es 9.460 9.840<br />

YAHOO SEARCH linkdomain:www.cindoc.csic.es 12.700 15.300<br />

EXALEAD link:www.cindoc.csic.es 1.448 2.016<br />

32


Delimitadores (IV)<br />

MOTORES DE<br />

BUSQUEDA<br />

ENLACE A SECUENCIA DE CARACTERES<br />

AGO'05 AGO'06<br />

AGO'05 AGO'06<br />

GOOGLE link:www.csic.es/cbic 7 639 link:www.csic.es/cbic/cbic.htm 288 639<br />

MSN SEARCH link:www.csic.es/cbic 15 16 link:www.csic.es/cbic/cbic.htm 3.015 2.666<br />

YAHOO SEARCH link:http://www.csic.es/cbic 44 69 link:http://www.csic.es/cbic/cbic.htm 11500 3130<br />

EXALEAD link:www.csic.es/cbic/cbic.htm 553 783<br />

GIGABLAST link:www.csic.es/cbic/cbic.htm 429 221<br />

33


Delimitadores (V)<br />

MOTORES DE<br />

PAISES<br />

BUSQUEDA<br />

AGO'05 AGO'06<br />

GOOGLE formulario (España) site:com 6.550.000 72.100.000<br />

MSN SEARCH loc:es site:com 50.797.387 41.904.669<br />

YAHOO SEARCH formulario (España) site:com 140.000.000 90.700.000<br />

ASK sedes nacionales 32.560.000<br />

EXALEAD formulario (España) site:com 15.902.881<br />

MOTORES DE<br />

IDIOMAS<br />

BUSQUEDA<br />

AGO'05 AGO'06<br />

GOOGLE formulario (español) site:com 18.000.000 163.000.000<br />

MSN SEARCH language:es site:com 114.474.312 117.455.638<br />

YAHOO SEARCH formulario (español) site:com 224.000.000 133.000.000<br />

ASK lang:ES site:com 114.330.000 58.020.000<br />

EXALEAD language:es site:com 12.333.552 31.087.150<br />

34


Delimitadores (VI)<br />

MOTORES DE<br />

BUSQUEDA<br />

TIPO DE FICHERO<br />

AGO'05 AGO'06<br />

GOOGLE filetype:pdf site:com 17.600.000 98.900.000<br />

MSN SEARCH filetype:pdf site:com 74.963.752 60.397.991<br />

YAHOO SEARCH originurlextension:pdf site:com 72.600.000 69.200.000<br />

EXALEAD filetype:pdf site:com 4.082.595 8.115.109<br />

GIGABLAST type:pdf site:com 133.271<br />

AGO'05 AGO'06<br />

GOOGLE filetype:doc site:csic.es 4.060 32.100<br />

MSN SEARCH filetype:doc site:csic.es 264 185<br />

YAHOO SEARCH originurlextension:doc site:csic.es 2.690 2.530<br />

EXALEAD filetype:doc site:csic.es 317 471<br />

GIGABLAST type:doc site:csic.es 109 195<br />

35


Tamaño<br />

36


Solapamiento<br />

37


Composición<br />

Google by Google<br />

Google by Notess<br />

38


Siguiendo a Notess<br />

Instalación de Copernico 5.2<br />

<br />

Capacidad de exportación a Excel<br />

Experimentos<br />

<br />

<br />

<br />

<br />

Cobertura<br />

Tamaño (Copernic)<br />

<br />

<br />

<br />

Búsqueda de términos (varios motores)<br />

Búsquedas delimitadas (cada motores)<br />

Teoría del máximo<br />

Solapamiento (Copernic)<br />

<br />

300 primeros resultados<br />

Calidad de los enlaces (Copernic)<br />

<br />

Porcentaje de enlaces muertos (un único motor seleccionado)<br />

39


Copernic<br />

40


Visualización<br />

Relaciones “ocultas”<br />

<br />

<br />

TouchGraph Google<br />

www.touchgraph.com/TGGoogleBrowser.html<br />

Instalación previa del Java JRE 1.3+<br />

<br />

<br />

Prácticas con un nodo<br />

Prácticas con más de un nodo<br />

Kartoo<br />

www.kartoo.com<br />

Prácticas con términos institucionales<br />

41


TouchGraph<br />

42


Kartoo<br />

43


Metabuscadores<br />

Primera generación<br />

Vivisimo<br />

ZapMeta<br />

Mooter<br />

iBoogie<br />

Infonetware<br />

MetaEureka<br />

Surfwax<br />

Info<br />

www.vivisimo.com<br />

www.zapmeta.com<br />

www.mooter.com<br />

www.iboogie.tv<br />

www.infonetware.com<br />

www.metaeureka.com<br />

www.surfwax.com<br />

www.info.com<br />

Segunda generación<br />

Copernico (5.2/6.1) www.copernic.com<br />

44


Límites de los Metabuscadores<br />

Resultados proporcionados por buscadores y metabuscadores (Octubre 2002)<br />

Términos de búsqueda: scientometrics ornithology "Albert Einstein" God<br />

Buscadores<br />

Metabuscadores<br />

ALLTHEWEB 6.718 258.498 1.108.420 39.421.287<br />

GOOGLE 8.260 112.000 554.000 36.800.000<br />

WISENUT 2.932 90.608 565.892 13.475.757<br />

ALTAVISTA 2.522 50.845 452.982 12.488.621<br />

TEOMA 2.087 42.290 233.850 7.535.000<br />

GIMENEI 73 70 71 82<br />

ICYSPICY 33 57 55 72<br />

METAEUREKA 42 46 56 73<br />

EZ2WWW 395 339 302 335<br />

IBOOGIE 221 238 236 299<br />

VIVISIMO 307 466 220 454<br />

FUZZLE 1.050 1.057 1.016 999<br />

45


Metabuscadores<br />

46


Recuperación automática inteligente<br />

Copernic 6.1 Pro www.copernic.com<br />

Indización<br />

Asignación automática de idiomas<br />

Filtrado por región y dominio<br />

WebQL<br />

www.ql2.com<br />

Demostración<br />

<br />

<br />

<br />

Identificación de los componentes de la URL<br />

Cadena de caracteres a extraer<br />

Muestra de trabajo<br />

47


Copernic<br />

48


WebQL<br />

49


Calidad, visibilidad e impacto<br />

Evaluación cuantitativa de sedes Web<br />

<br />

El modelo Google<br />

<br />

<br />

Instalación de la ToolBar (toolbar.google.com)<br />

Page Rank<br />

<br />

<br />

Visibilidad<br />

<br />

<br />

<br />

<br />

Escala logarítmica<br />

rankwhere.com/google-page-rank.php<br />

www.rustybrick.com/pagerank-prediction.php<br />

Componentes: visibilidad + peso<br />

Tipos de enlaces: inlinks, outlinks, selflinks, backlinks<br />

Cálculo mediante el uso de motores de búsqueda<br />

Impacto Web (WebIF)<br />

Calidad de los enlaces: Inspectores de enlaces<br />

50

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!