Vistas de página en total

sábado, 29 de noviembre de 2014

Tema 5

Recuperación de la información

Cuando realizamos una consulta en Internet el reto principal es conseguir que la pregunta recupere los documentos que se consideran realmente relevantes. Para conseguir esto entramos en un proceso en el cual lo principal que el navegador tiene que lograr es a acceder a una base de datos. Para filtrar los datos que a nosotros nos interesan, ordenarlos por la relevancia que tienen para el usuario y después poder ofrecernos una selección de los datos que son más adecuados para nosotros.




















Modelos de búsqueda y recuperación de la información

En muy pocos año el numero de usuarios en la red ha aumentado mucho. Esto ha provocado que el número de documentos disponible en la red haya sufrido un gran aumento. A juzgar por el crecimiento en la cantidad de servidores en funcionamiento en la red. En consecuencia, la Recuperación de información se ha ido convirtiendo en un campo de conocimiento cada vez más necesario al que acudir en busca de soluciones. Y tenemos tres modelos principales de búsqueda y recuperación de la información:



  • Booleano: Este modelo está basado en la teoría de conjuntos y en el álgebra de Boole.Los documentos están representados por un sistema binario [ 0, 1 ] . El "0" indica que el término no figura en el documento, mientras que el "1" refleja que si está, aunque desconocemos si una o varias veces. La búsqueda se realiza a partir de la ecuación introducida por el usuario en el sistema de recuperación.El booleano es el más utilizado en los sistemas de recuperación de la información tanto por su sencillez como por su carácter intuitivo. Pero tiene algunos problemas en relación a la relevancia de los documentos recuperados. [1]


  • Probabilístico: Este modelo también esta basado como el booleano en un sistema binario mediante el cual establecemos la existencia o no de un término en un documento. La mayor aportación de este modelo viene dada por la forma en que el sistema trata la consulta efectuada. Así, a través de cálculos probabilísticos y la aplicación del teorema de Bayes, el sistema procede con la ponderación de los términos y así da forma a la consulta, recuperando los documentos. [1]


  • Modelo vectorial:  Este modelo está basado en que los documentos pueden ser expresados en una matriz en la que figuran los términos y la presencia de los mismos en los documentos. En el instante en que el un usuario realiza su búsqueda de información, el sistema reduce el contenido de la búsqueda a un vector. Y después compara ambos vectores para establecer semejanzas existentes entre ellos. En función de la semejanza de los vectores el sistema procede a devolver al usuario una serie de documentos que se consideran relevantes.  A diferencia del modelo booleano que solo tiene dos únicas posibilidades [0=no figura,1=sí figura], este puede asignar a cada término un peso específico [0,5 - 0,7 - 0,9...], diferente en cada caso y en función de la importancia o frecuencia que posea en cada uno de los documentos. Es un aspecto muy relevante ya que se consigue salvar la limitación relacionada con la frecuencia y la relevancia que suponía uno de los grandes inconvenientes del modelo booleano. Porque a partir de este modelo es posible devolver una relación ordenada de documentos en función de la relevancia, algo que el modelo booleano no es capaz de ofrecer. [1]


Actualmente la recuperación de información ha cobrado una gran importancia debido al crecimiento de Internet. Tratando de facilitar la tarea de distinguir de los escasos documentos relevantes que puedan existir en la red frente a los millones de 
documentos irrelevantes en relación a cada consulta que un usuario realiza.
Como hemos podido observar anteriormente, lo más destacado actualmente en estos sistemas de recuperación de información consiste en el empleo simultáneo de 
características y algoritmos propios de cada uno de estos modelos. Así, lo más frecuente es que los buscadores de Internet se basen en el modelo booleano, pero efectúen la ordenación de los documentos de las respuestas empleando criterios del modelo vectorial. En consecuencia, con la popularización de Internet han cobrado importancia los modelos clásicos de recuperación de información.

La búsqueda y recuperación de la información va mucho más allá de meter un palabra en un buscador y que nos den algunos datos con la información que hemos solicitado. Todo esto tiene un funcionamiento más especifico que la mayoría de la gente no conoce porque con saber que funciona les vale a nivel de usuario. En cambio si alguien tiene el interés en el tema siempre necesita saber el porque de lo que hay detrás de una cosa tan simple como dar a una tecla y que nos aparezca información sobre lo que hemos solicitado. Estaría bien que todos supiéramos como funcionan las cosas que utilizamos porque Internet es un mundo muy amplio y novedoso del que hay mucho que conocer, ya que es muy complejo y el usuario eso no lo percibe.  Anteriormente hemos visto un poquito sobre la recuperación de la información y sobre los modelos principales que se usan para este fin y así intentar comprender mejor la recuperación de la información.


Referencias:

[1] http://modelosbusqueda.webcindario.com/indexmodelos.html

[T] http://ict.udlap.mx/people/carlos/is346/admon08.html
[T] http://slideplayer.es/slide/1856908/

jueves, 6 de noviembre de 2014

Tema 4

Los buscadores de Internet


Un buscador es una página de Internet que permite realizar búsquedas en la red. Son muy sencillos de utilizar, basta con introducir una o más palabras clave en una casilla y el buscador generará una lista de páginas web que se supone guardan relación con el tema solicitado. 

Aun que es muy fácil de usar a nivel básico, los buscadores permiten opciones avanzadas para refinar la búsqueda, cuyo resultado puede ser en muchas ocasiones de miles de páginas. Mediante estas opciones avanzadas se puede acotar la búsqueda y obtener un número de páginas más manejable. 

Debido al gran tamaño de Internet y a su naturaleza cambiante, ningún buscador posee registro de todas las páginas que se encuentran en la red. Por ello es aconsejable visitar más de un buscador para contrastar los resultados y en ningún caso pensar que si una página no aparece en un buscador, es que no existe. 

Estos buscadores poseen enormes bases de datos que contienen información referente a páginas web. Estas bases de datos se generan por las altas de usuarios que han creado sus páginas web. Si el creador de la página no se da de alta en el buscador, la página no aparecerá. Para las empresas es muy importante promocionar sus páginas en los buscadores para que la gente las encuentra fácilmente. 
Actualmente tenemos disponibles bastantes buscadores. Vamos a tratar de hablar un poco sobre los mas destacados, de sus diferencias y de las ventajas de cada uno de estos buscadores.


Los buscadores más actuales



Es el buscador web más utilizado en Internet con más del 70% de usuarios de la red. Propiedad de Google Inc. El objetivo principal del buscador de Google es el contenido de alta calidad en las páginas web, en lugar de otro tipo de datos.


Además de ser un motor de búsqueda, con el tiempo ha ido ampliando sus servicios hasta convertirse en el líder absoluto.

                                                         
Es un buscador esencial para la vida profesional de la gente. Es el más utilizado por los profesionales en la informática. Es sin dudas el competidor nato de Google. Durante muchos años, fue el líder en búsquedas y poco a poco se fue haciendo conocido como un portal. En el que además de buscar contenidos obtenías servicios de alta calidad como lo eran los desaparecidos grupos, directorios, noticias, email y más. Su motor de búsqueda se caracteriza por brindar los resultados más ajustados y exactos a tus intereses.




Antes lo conocíamos con el nombre de Live Search. Es el buscador oficial de Microsoft, menos del 10% de los internautas utilizan este motor de búsqueda. Se caracteriza por tener una imagen de fondo muy atractiva. Su búsqueda se basa en el sistema Powerset 2. Además de la búsqueda tradicional te permite realizar una lista de búsquedas relacionadas y personalizarlas de acuerdo a tus preferencias.



También conocido como Ask Jeeves es un buscador que se caracteriza por la respuesta a distintas preguntas. A simple vista parece un motor de búsqueda como cualquier otro, sin embargo, intenta responder de forma sencilla aquellas preguntas que pueden surgir a través de la búsqueda de la palabra clave que has realizado.  [3] Interesante buscador para ampliar conocimientos insospechados. 

Depende también de Google, pero a diferencia de los demás, permite hacer un enlace directo con redes sociales como Facebook, Twitter, Linkedin y enviar la búsqueda que realicemos por correo electrónico al instante. Tiene un plugging de búsqueda muy utilizado en el navegador Firefox. Hay que cuidar los datos que se colocan en las redes sociales, sobretodo porque búsquedas que no quieres pueden ser publicadas en la red social. 


Es a día de hoy el buscador que más se diferencia de Google gracias a su sistema de “búsqueda inteligente”. Además de utilizar las típicas búsquedas sistemáticas, Chacha, se basa en incluir la inteligencia humana para que los resultados arrojados sean acordes a lo que queremos. Con un grupo humano completo, estas personas llamadas “asesores de búsquedas”, ayudan al usuario, por un precio muy bajo, a obtener lo que busca sin tener que leer publicidades ni pasar por tantas páginas con información innecesaria. El método de ponerse en contacto con los asesores es variado, tal como su precio. Su filosofía es la productividad, en estos momentos donde nuestro tiempo vale oro. 



Fue el primer buscador completo en internet generando la primera gran base de datos donde realizar búsquedas en la red. Actualmente fue comprado por Yahoo. Ofrece serviciosmuy utilizados como traductor, filtro, páginas amarillas y buscador de personas. Su plataforma es muy sencilla de utilizar y completamente intuitiva desde todo punto de vista. 


Si bien su sistema de búsqueda y clasificación depende de la empresa Google, su interface permite realizar búsquedas que contengan videos, fotografías, y sonidos en tiempo real. Su principal fuerte es la búsqueda de noticias. 

Baidu es un buscador en idioma chino con sede en Pekín fundado a finales de 1999 por Robin Li y Eric Xu. Su diseño es similar al de Google e incluye la posibilidad de búsqueda de noticias, imágenes y canciones, entre otras funciones. Quizá la característica más popular de Baidu, que otros motores de búsqueda como Google no ofrecen, es la posibilidad de efectuar búsquedas de archivos de audio (MP3, WMA/SWF...). 

Es usada fundamentalmente para la búsqueda de música pop china, y los resultados de la búsqueda son sorprendentemente precisos. Baidu puede realizar estas búsquedas debido a que las leyes de la República Popular China no prohíben poner música en Internet, y Baidu se encuentra bajo jurisdicción china. Con un 80% de mercado en China, el buscador Baidu desea ampliar su campo de acción, para internacionalizarlo. 





Yandex es el nombre de un buscador web de Rusia. Los resultados se muestran en ruso, ucraniano, bielorruso y kazajo. En Rusia es el buscador que domina el mercado, muy por encima de Google. El buscador ruso, Yandex no es solo un buscador, al igual que Google tiene muchos servicios paralelos.Yandex nació en el mismo año que Google, pero este último perdió la oportunidad de hacerse con el mercado ruso por culpa de su pobre comprensión del idioma cirílico. Lo que dio a Yandex la ventaja suficiente para hacerse con el mercado de las búsquedas en Rusia.






En mi opinión aunque la mayoría de usuarios da mucho más uso al buscador Google, no tiene porque ser el mejor, fue el primero que usamos y tenemos la costumbre de usar ese motor de búsqueda, pero hay muchos otros y no tienen porque ser peores. Un poco más arriba hemos podido leer algunos de los buscadores más actuales y más usados en el mundo con sus principales características. Ahora vamos a ver en que países se usan los principales buscadores.



Google es el buscador más utilizado con diferencia se usa en la mayoría de países de Europa, seguido de Bing y Yahoo. En la mayoría de países europeos las búsquedas a través de Google, superan el 90 %, en España con un 98 %, es uno de los países europeos que más se utiliza este buscador. La excepción es Rusia con un 50 % aproximadamente, seguido muy de cerca por buscador ruso Yandex.

Las búsquedas a través de Bing situado en segundo lugar, después de Google, es Gran Bretaña, el país donde es más utilizado, superando ligeramente el 4 % de las búsquedas, y finalmente Yahoo, donde también es Gran Bretaña, el país europeo donde más se utiliza, cerca del 3 %.


En Asia es China con Baidu el buscador principal con una cuota próxima al 70 %, seguido de Google con un 28 % aproximadamente, y Yahoo con algo más del 1 %. Japón, el buscador predominante es Google con un 70 %, seguido de Yahoo,  con una cuota de un 28 %.


En EEUU, Google representa alrededor de un 80 % de las búsquedas,  Yahoo próximo al 10 % y Bing un 9 %. [1]


Referencias:

[T] http://tyccrazy.blogspot.com.es/2014_10_01_archive.html
[T] http://communitymanager.blogia.com/temas/herramientas-para-cm.php
[T] http://www.webquest.es/wq/bachillerato/buscadores-internet
[T] http://www.tnrelaciones.com/anexo/buscadores/baidu.html
[1] http://www.webyposicionamientoseo.com/cuales-son-los-navegadores-y-buscadores-que-mas-se-utilizan-en-el-mundo.blog