
Nos hemos acostumbrado, desde el principio de los tiempos web, al funcionamiento de los buscadores adaptándonos nosotros a su forma peculiar de entender y clasificar la información. Estoy seguro que cuando entras en una agencia de viajes y te sientas delante del agente no se te ocurre decir: “vuelo+hotel barato tarragona” (eso espero !).
Y es que resulta que los contenidos que generamos y que publicamos en la web únicamente son comprendidos, entendidos e interpretados por nosotros, las personas y no por las herramientas que nos ayudan a clasificar y devolver resultados en las búsquedas. Es decir, subimos a la red contenido con significado, con relaciones entre datos, con opiniones, con revisiones que el buscador generalmente no va a saber interpretar a la hora de ofrecer sus resultados para búsquedas con significado o búsquedas semánticas.
Imaginemos un buscador que realmente busca en TODA la red contenido con significado, contenido relacional, contenido no exclusivo de páginas web y blogs, sinó contenido que se ha generado en redes sociales, contenido generado en cualquier tipo de formato (audio, video, texto, imágenes…), contenido almacenado en hosting sociales…produce un poco de vértigo, ¿no?.
Por un lado la mejora en el resultado de las búsquedas es evidente: la posibilidad del buscador de poder entender el “lenguaje natural” con el que normalmente nos expresamos y poderlo aplicar a los contenidos posibilitará que en su proceso de búsqueda, va a analizar los contenidos viendo la relación y el significado de cada uno de ellos y entre ellos y, por tanto, ofreciendo resultados que se van a acercar mucho a nuestra petición: “busco un vuelo ida y vuelta desde madrid a tarragona con alojamiento en hotel por una noche de precio total inferior a 300 €“. Tanto la cantidad como la calidad de la información indexada y devuelta en forma de resultados para búsquedas mejorarían notabilísimamente, de eso no creo que tengamos duda.
Pero por el otro lado nos encontramos con algunos problemas de peso, problemas que hacen ralentizar ese salto hacia el “significado”. Básicamente dos tipos, el primero es de carácter puramente técnico o tecnológico y hace referencia al acuerdo para el uso de un sistema estándar, esto es, conseguir un acuerdo para la utilización de un estándar para la información de la red: hasta ahora existen dos corrientes de actuación, los defensores de la web semántica tradicional (RDFa) y los más prácticos que buscan más el corto plazo con los microformatos (formatos que ya se usan por ejemplo en Technoratti).
El segundo problema, el que da título a este post. Claro, cuando decidimos explorar también los datos incluidos en redes sociales empezamos a entrar en un tema donde el suelo ya no es tan firme. Es más que posible que los usuarios no quieran revelar sus datos privados para que sean tenidos en cuenta en las búsquedas. Y no digo datos privados al uso (nombre, email, direccion…etc), me refiero a opiniones vertidas en grupos de discusiones, foros … etc y que por tanto deseen ser excluidos de ese ojo que todo lo ve.
La paradoja es interesante: por un lado nos interesan los resultados de calidad, resultados relacionales y con significado relevante, pero por otro lado, es muy posible que no deseemos que sean incluidas o tenidas en cuenta nuestras revisiones y opiniones personales vertidas en redes sociales, que en muchos casos y para muchos productos son la fuente más importante de información de primera mano sobre los mismos… uhmm complejo ¿no?
Salu2

993 usuarios
80 grupos
1431 fotos
280 blogs
2731 posts
8808 comentarios
90 ideas



En su momento, el buscador Ask Jeeves intentó marcar el camino, siendo un buscador en el que podÃas realizar búsquedas normales, y "entendÃa" lo que un usuario estaba buscando, aunque nunca acabó de cuajar.
Tal y como dice Oriol, parece que lo que algunas han empezado a denominar "la web semantica", podrÃa ser una posible solución a este tema.
Hola amics, básicamente nos encontramos con dos problemas para ese salto hacia unos resultados de calidad:
- Técnico: en cuanto a la estandarización del formato de los contenidos que deberÃan subirse a la red para que puedan ser analizados atendiendo a los contenidos, a las relaciones y significado de los mismos
- Disponibilidad de los datos: generalmente una de las grandes fuentes de información de primera mano sobre productos y servicios está en el seno de comunidades y sitios sociales, donde las revisiones y comentarios sobre esos productos se hace tanto de manera formal como informal. Imaginaos poder trackear ese contenido para poderlo ofrecer como resultado que complementa una búsqueda de un producto o servicio. Pero por otro lado, como comentaba en el post, es el usuario el que va a decidir sobre quién va a poder indexar, leer, trackear su perfil, información publicada, opiniones ...
Como casi siempre, la parte técnica es siempre la que se resuelve, o se acaba resolviendo, de manera más sencilla.
El debate está en el segundo punto, claro !!! :)
Creo que se merece un poco más de reflexión y otro post.
Salu2
Oriol, no me pareces ingenuo, ya me gustaria saber lo que tu sabes, pero si que me preocupa en este sentido la protección de datos, (hackers siempre los habrá, o no), pero si los que tienen el poder (polÃtica, servicios de inteligencia,...) seran los mismo que podran acceder a dicha información, y podran "censurar" a los que opinien en contra de sus intereses.
Claro que es mas importante la información que se genere, que no quien la genere, pero en mi opinión, funcionará siempre y cuando los que manden no hagan uso de el "lado oscuro" del poder, sobre la cual cosa no podremos tener ninguna garantia, no crees?
Lo del la clave se resuelve del mismo modo que se mantienen secretos los datos en las transferencias bancarias o en el tema de la firma electrónica. Si existe una entidad pública auditada y de confianza puede tener estos datos protegidos.
Personalmente pienso que lo que tiene más valor es la información que se genera, no tanto quién la genera. La idea de George Orwell del Gran Hermano, fué pensada en 1949, en su novela 1984, y a pesar de que las herraientas de la CIA eran mucho más sofiticadas en 2001, no consiguieron darse cuenta de como y quien estaba preparando los ataques del 11 S.
Quizad parezca ingenuo, pero hay maneras de proteger los datos personales, y además, la cantidad de información que se genera resulta aún difÃcil de poder objetivar tant facilmente. Aunque, seguramente, todo se andará.
Oriol, no termino de estar de acuerdo con tu opción de protección de datos personales (en la realidad de hoy dia, no en el matrix que he montado antes) puesto que como siempre quien tiene la clave para relacionar el código con las personas vuelve a tener el poder, y eso es delicado, muuuy delicado....
Oriol, pues una muy buena idea lo que explicas sobre la protección de datos personales.
Estoy de acuerdo con Aris.
Si lo que se entiende por 2.0 (que a grandes rasgos creo que podrÃa hablarse de una relación bidireccional entre empresa y consumidor y del fomento de la inteligencia colectiva y colaborativa)está costando...para lo del 3.0, necesitamos mucha práctica y cambio de mentalidad.
A todo esto, lo que comentas en relación a la web semántica o contenido con significado para las búsquedas, serÃa de lo más útil y efectivo, no? Vaya...
Otro tema de gran importancia es que la web semántuica aún necesita de ontologÃas suficientes, capaces de establecer aquellas relaciones entre conceptos, sin las cuales, la web semántica no puede entender todos los textos.Este campo aún está por desarrollar. Por ejemplo, en el turismo, existe una ontologÃa en WordNet, que es la organización que ha desarrollado más ontologÃas, pero también hay otra, en la que han participado organizaciones españolas y que es da crácter europeo, que es Harmonize.
Lo de la protección de los datos es más fácil de regular de lo que parece, y se podrÃa hacer que los ordenadores borrasen los datos personales y sólo retuviesen códigos para cad persona que a un extraño no le dijera nada, pero que al interesado le serviria para poder tener un histórico de sus actividades en Internet.
Personalmente, creo que hay aún mucho camino que recorrer y si bien la incorporación paulatina de XML en los programas informáticos, sin unas buenas ontologÃas, que hagan de repositorio donde los ordenadores contrasten los términos para poder establecer las relacioines, no habrá web semántica real.
Un paso mas allá, diria yo, mas que complejo ...
Creo que nosotros todavia no estamos preparados para el 3.0, ¿o será parte del 2.0?, en mi opinión nos falta ser mucho mas liberales, democráticos, éticos, respetuosos,....
para poder llegar al dia en que no nos importe que alguien sepa nuestras opiniones, las use para su beneficio, las use para ayudarnos, o simplemente no las use, el dia que para nosotros (el mundo), no importe que ideales polÃticos tenga una persona, que no exista la derecha ni la izquierda, si no que se hagan las cosas bien, por el interés común, sin menospreciar a nadie ni nada, el dia que no exista la pobreza, ese dia, lo que tu encuentras complejo, ya no lo serà . Està fotut s'asunto...