Home Notas Weblog Downloads Manuales Mis programas Diseño web Links Correo Información legal Mejor visto en ... FAQ Acerca del autor Menú
RSS 1.0

La web semántica

¿Sueño o realidad?

La World Wide Web que conocemos ahora, la que existe desde hace 10 años, es obsoleta. Es una mierda. La inmensa mayoría de las páginas web que ves cuando navegás, están mal hechas.

El estándar anterior de la web, el que se sigue usando, sólo sirve para mostrar una información. No para catalogarla, clasificarla u ordenarla. De hecho, las primeras versiones de HTML sólo se interesaban en la presentación y no poseían estructura. Parecido a lo que pasa en un archivo de Word.

Para que lo entiendas, acá te muestro un ejemplo en código HTML:

<font size="5" color="red">Recetas de cocina</font><br><br>
<font size="3" color="black">En esta página vas a encontrar <b>muchas recetas de cocina</b> para que aprendas.</font>

Lo que ves arriba podría significar que hay un título grande y rojo que dice "Recetas de cocina", el resto que está en negro y con una letra más chica sería el texto de la página, con la frase "muchas recetas de cocina" resaltada en negrita.

Esto es HTML viejo, su énfasis está en cómo se ven las cosas, y no en lo que significan. Si estuviera bien hecho, sería así:

<h1>Recetas de cocina</h1>
<p>En esta página vas a encontrar <strong>muchas recetas de cocina</strong> para que aprendas.</p>

Lo de recién es código HTML nuevo, estructural. Los elementos sí tienen un significado. Lo que está entre h1 es un header level 1, o sea un encabezado de alta importancia. Lo que está entre p es un párrafo, y lo que está entre strong tiene un énfasis fuerte. Los colores y los tamaños de letras estarán especificados en una hoja de estilos.

¿Por qué es tan importante que las páginas tengan estructura? Porque si la tienen es mucho más fácil que los programas puedan procesar su información, sabiendo qué importancia tiene el texto dentro del documento, cuál es su orden, la relevancia, y en especial, las relaciones entre la información. Y esa es la base de la web semántica.


El RDF

El nuevo estándar para la web es RDF, formato de descripción de recursos. A diferencia del HTML, el RDF no sirve para expresar una información en un documento, sino para ordenar y catalogar la información en otros documentos. No son datos, son metadatos, datos acerca de los datos. El RDF es la base de la web semántica.

Quizás uno de los mayores defectos de la web actual es la falta de índices. Todo el tiempo veo a los boludos que escriben las URLs de sus sitios en los vidrios de sus autos, y sus remeras para que la gente conozca la dirección. Si la web estuviese bien ordenada y clasificada, no haría falta que la gente conozca la URL. Entrarían igual.

Los buscadores actuales buscan los strings en el texto de las páginas. Una de las aplicaciones prácticas del RDF se llama Dublin Core, es un sistema de clasificación que da 15 categorías de metadatos, como creador, título, fuentes, etc. De este modo se puede buscar, por ejemplo, "biografías de Simón Bolívar escritas por Félix Luna en los últimos 10 años, en castellano", en lugar de simplemente poner "Simón Bolívar" en Google.

Se pueden crear documentos en RDF que indexen a decenas o centenas de documentos HTML especificando una gran variedad de datos acerca de los mismos. A su vez, estos índices estarían indexados en índices maestros. De más está decir que el HTML de las páginas sería estructural, lo cual genera el enorme potencial de la web semántica.

Este es un ejemplo de lo que se podrá hacer cuando la web semántica esté completamente operativa:

Juancito debe hacer un trabajo práctico sobre Irlanda para la escuela. Va a su casa, prende la computadora, abre su agente-navegador y le especifica "Crear un trabajo práctico acerca de Irlanda, basándose en información del gobierno de Irlanda, embajadas y los datos cartográficos del Ejército. Debe abarcar la historia irlandesa desde la edad media hasta la actualidad, la geografía del país, recursos económicos y realidad cultural. Debe tener entre 40 y 55 hojas impresas, incluyendo mapas y diagramas."

Juancito deja el programa corriendo y se va a jugar a la pelota. Cuando vuelve, el trabajo ya está impreso. Tiene un trabajo práctico completo, en castellano, perfectamente documentado desde los celtas hasta el IRA y U2. Se saca un 10 (la nota máxima) y ni siquiera lo leyó.

La web semántica sería la verdadera revolución de la información. Ahora estamos muy lejos de eso.


La triste realidad

Estamos muy lejos de tener una web semántica. Como dije antes, la web actual es una mierda obsoleta. El mayor problema es que la gente edita HTML con programas viejos como Front Page que nunca actualizaron.

Las páginas no son accesibles, son tétricas increíblemente pesadas y dependientes de Flash y otras tecnologías propietarias.

Los expertos en informática tendremos que "evangelizar" a muchos diseñadores web si algún día queremos disfrutar de los beneficios de la web semántica.

Por ahora tenemos algunos sitios que ya incluyen algo de la tecnología semántica (como éste, ejem) y ciertas aplicaciones que las usan, aunque más no sea a un nivel básico.


XHTML válido CSS válido ¡Bajate Firefox! ¡Instalá el soporte Java ya! Algunos derechos reservados