De SeCulart. Metodología informativa para la web

Miriam Estrada
(Fragmento)

El realizar una consulta en algún buscador de Internet es un paso relativamente fácil para cualquier usuario, pero encontrar la información que se requiere con parámetros de calidad, coherencia y secuencia resulta complicado para la mayoría.

Y es que la cantidad de documentos que circulan en la red obliga a los motores de búsqueda a delimitar los resultados; si bien la opción avanzada de Google permite tener acceso a información contenida en formatos diferentes al clásico HTML aún hay muchos datos que no son considerados simplemente porque durante su generación no fueron indexados de manera adecuada, carecen de metadatos o bien porque el mismo buscador ha privilegiado aquellos resultados que han sido patrocinados.

De esta manera, la saturación genera nuevos retos para las Tecnologías de la Información, y es por ello que académicos e investigadores han dedicado tiempo y esfuerzo para la reorganización de los mismos. En este entorno es en el que surgen la tecnología lingüistica y la web semántica.

En "SeCulart: Integración de fuentes documentales sobre cultura mediante Web Semántica" se explica en qué consiste el proyecto financiado por  asociaciones y fundaciones (como Euskomedia Fundazioa, Asociación Vicomtech, Ministerio de Industria, Comercio y Turismo): Seculart.

 A decir de los autores, el objetivo es la introducción de tecnología lingüistica para mejorar el desarrollo e interoperabilidad de fuentes de datos culturales; sin embargo, el análisis sobre el proyecto SeCulart permite imaginar y plantear su uso en otras áreas, como el Periodismo.

En la exposición del objetivo de Seculart se retoman los cambios suscitados en el uso de Internet: el usuario no se limita a realizar consultas de información sino que también la produce en cada búsqueda, en cada comentario, en cada interacción o colaboración y la pone a disposición de los demás; no obstante, nuevamente la cantidad de información provoca que los otros experimenten frustración al utilizar buscadores comunes (Google, Vista, Msn, entre otros) y reciban resultados repetidos o deficientes en calidad. Y es que cantidad no es igual a calidad en el contenido.

El objetivo de la web semántica es el desarrollo de una metodología para obtener una clasificación con base en su significado, y para conseguirlo se necesita la construcción de herramientas que simplifiquen la clasificación de los millones de documentos que deben ser analizados. Esa es la tarea para las Tecnologías de la Información; en el proyecto SeCular se aplican técnicas de Procesamiento del Lenguaje Natural (PLN) con esto se extrae información de forma automática de documentos, pero si bien esto facilita la labor de los documentalistas no sustituye su trabajo final.

El proyecto provoca preguntarnos cómo estamos realizando consultas de información en la web, con qué resultados nos estamos quedando y si éstos cumplen con los requerimientos de calidad e interés; al mismo tiempo se abre una nueva interrogante: ¿Cómo estamos produciendo, difundiendo y almacenando nuestra información?, ¿Nos estamos asegurando que estará disponible para nosotros mismos y para los demás? Para tener la certeza de que nuestros trabajos cumplan con los requisitos de calidad debemos, entonces, poner especial atención a la semántica: Cada palabra tiene que tener un significado necesario e insustituible para la comprensión de nuestros escritos; pero, además deberá pasar por una metodología informativa para la web, es decir, contar con palabras clave, metadatos, vínculos, etcétera, que faciliten su consulta.

Adicionalmente, en la construcción de nuestro material tomaremos en cuenta el uso de sistemas de integración semántica que pueden ser desde enlazados de información (vínculos), “data warehouses” hasta sistemas distribuidos capaces de retroalimentarse por sí mismos.

Con lo anterior, estaremos en condiciones de ofrecer a nuestros lectores los datos útiles concretos.



Bibliografía

Agerri, R., Orbegozo B., & Sarasua, C. (2014). SeCulart: Integración de fuentes documentales sobre cultura mediante Web Semántica. Mayo 7, 2015, de EuskoNews Sitio web: http://www.euskonews.com/0527zbk/gaia52703es.html

Codina. L. (2003). Internet invisible y web semántica ¿el futuro de los sistemas de información en línea?

Franco, A.. (2004). El discurso periodístico a través de la lingüística textual. Mayo 7, 2015, de Revista de Ciencias Humanas y Sociales v.20 n.43 Sitio web: http://www.scielo.org.ve/scielo.php?pid=s1012-15872004000100006&script=sci_arttext

Anguita, A.. (2012). Modelo de mediación semántica para la integración de fuentes de datos heterogéneas. Mayo 7, 2015, de Universidad Politécnica de Madrid. Facultad de Informática Sitio web: http://oa.upm.es/14641/1/ALBERTO_ANGUITA_SANCHEZ.pdf


Comentarios

Entradas populares