De la Web 1.0 a la 3.0

Muchas veces nos hemos preguntado cómo puede ser posible que algún día los datos informáticos puedan ser procesados semánticamente, es decir, cómo el propio código se interprete a sí mismo y pueda interaccionar con otros datos sin intervención humana. En su origen, la web, denominada web 1.0 surgió por la necesidad de intercambiar información, en cambio, la conocida Web 2.0 se caracteriza porque los usuarios son quienes producen e intercambian contenido; es una web social. De ahí, que estemos en un momento histórico gracias a Internet: la humanidad nunca antes había tenido tanto contenido escrito o audiovisual y había tenido un acceso tan inmediato. En estos momentos, se está dando una evolución. Algunos afirman que la Web 3.0 está próxima. La web 3.0 se caracteriza por 3D (realidad aumentada), Geolocalización e Inteligencia artificial (o web semántica). Nosotros nos vamos a deterner en este último rasgo.
Según Tim Bernes-Lee, el padre del a WWW, una web semántica es una red de datos que pueden ser procesados directa o indirectamente por máquinas. Ahora bien, no lo hacen del mismo modo que procesamos nosotros el significado. Los hablantes generamos e interpretamos el significado a partir de una palabra, una frase o, incluso, un gesto o un sonido (por ej., cuando decimos “Aaaaaaaah” mientras hablamos por telefóno damos a entender que hemos entendido algo). El significado puede proceder de cada uno de estos niveles o en conjunto, de forma multimodal. Este es el primer gran problema: el procesamiento multinivel. Las máquinas que procesan la información de la web no suelen analizar de este modo; el código HTML no permite esta opción. Otro escollo con el tienen que contar los especialistas de la web semántica es la capacidad que tenemos los hablantes para segmentar nuestro conocimiento en conceptos o en palabras. La clasificación del conocimiento del mundo o enciclopédico se denomina ontología.Hay muchas formas de categorizar el mundo porque no olvidemos que el significado son las etiquetas que ponemos los hablantes a las cosas para entendernos unos con otros y en dicho significado influyen motivaciones lingüísticas (la denotación, el significado literal, y la connotación, el significado evocador o figurado), culturales (por ej., el eruptar en la mesa en algunos países árabes denota gratitud por la comida) o la creatividad de los hablantes, entre otros. Incluso los lingüistas no se ponen de acuerdo en cómo categorizar el conocimiento. Las dos perspectivas que más convencen son: el estructuralismo lingüístico y la lingüística cognitiva. El primer modelo segmenta nuestro mundo conceptual en campos semánticos. Según esto, las palabras están vinculadas unas con otras según su ADN semántico compuesto por “semas” y se unen por nódulos conceptuales, esto es, las palabras o los conceptos se vinculan unas con otras a modo de cerezas. Por ejemplo, el concepto “SEO” está compuesto por , entre otras. Por otro lado, encontramos la semántica de marcos (frame semantics) de la lingüística cognitiva. Para los lingüistas e informáticos que aplican este modelo el conocimiento se entiende como una red léxica en la que un concepto genérico se despliega en otros más específicos, por ejemplo, INTERNET > WEB, SITE, PRODUCTO, etc. Ambas perspectivas tienen en común el considerar nuestro léxico como una red conceptual compuesto por palabras que están vinculadas por su significado.
Curiosamente, el sistema ontológico sobre el que se basa el buscador de Google, denominado "Knowledge Grahp" o Mapa de Conocimiento emplea este mismo punto de vista de organizar el conocimiento. Como verás en este vídeo de Google, las coincidencias entre la forma de organizar los conceptos en los diccionarios llamados Thesaurus o Tesauros y el Knowledge Graph de Google están basados en un principio conexionista semántico por el que cual los conceptos se agrupan por vínculos semánticos, los cuales se atomizan y permiten enlazar una palabra con otra, optimizando así la búsqueda. Este mapa conceptual nos recuerda al que los informáticos emplean en cada dominio, el llamado Linked Open Data, que son los conjuntos de datos que se encuentran vinculados.
La semántica influye de forma directa en el posicionamiento orgánico en buscadores, el SEO. Esto se observa con el uso del Open Data que son los datos que son expuestos por parte de cualquier organismo para uso público. La empresa o entidad que emplee mecanismos de corte semántico como el RDFa , que genere sus contenidos pensando en la calidad y en el potencial semántico puede mejorar notablemente su CTR (Click-through rate), su tráfico. Así pues, el futuro de los códigos está en el desarrollo del etiquetado semántico dentro de los propios códigos. Algo que consideramos que se dará muy pronto ya que todos los esfuerzos de los expertos y especialistas en Big Data y HTML (entre otros lenguajes computacionales) se centran en crear un sistema capaz de autogestionar la información por medio del reconocimiento semántico.Todas las nociones teóricas y prácticas expuestas en este post son conocidas por expertos en Posicionamiento en buscadores orgánico y de pago (SEO y SEM, respectivamente). Es básico tener en cuenta cuál es la metodología que emplea Google en sus búsquedas y cómo sugiere términos a los usuarios en virtud de esta red de redes, esta vez, léxico-semántica, basada en el parentesco semántico.