reminiscencia del árbol o la red centralizada levantan barreras entre lenguas con un 89% de similitud léxica cuando por otro lado siguieren paridades del tipo español-ingles portugués-ingles." /> reminiscencia del árbol o la red centralizada levantan barreras entre lenguas con un 89% de similitud léxica cuando por otro lado siguieren paridades del tipo español-ingles portugués-ingles." /> reminiscencia del árbol o la red centralizada levantan barreras entre lenguas con un 89% de similitud léxica cuando por otro lado siguieren paridades del tipo español-ingles portugués-ingles.">

LasIndias.blog

Conquistar el trabajo es reconquistar la vida

Grupo de Cooperativas de las Indias

videoblog

libros

Tesauro latoc: eliminar zonas de sombra artificales en el mundo latoc

Todos los tesauros disponibles funcionan sólo para una variante del latoc (español, portugués..) generando zonas de sombras artificiales en un espacio lingüístico único. La lógica del mundo puzzle y la reminiscencia del árbol o la red centralizada levantan barreras entre lenguas con un 89% de similitud léxica cuando por otro lado siguieren paridades del tipo español-ingles portugués-ingles.

El latoc configura un espacio lingüístico único al que solemos referirnos como mundo latoc. Sus 9 variantes no sólo tienen orígenes comunes y gramáticas muy cercanas, sino también un alto grado de similitud léxica. Español y portugués, las lenguas más distantes entre si del grupo, tendrían, según Ethnologue un 89% de similitud léxica.

El latín occidental es el segundo grupo lingüístico del mundo en número de hablantes con alrededor de 600 millones, en su mayoría concentrados en América. Precisamente en América, Bazar, el primer software desarrollado por Garum Fundatio, ha empezado a implantarse cada vez en más sitios. Rancagua, Gijón, Madrid, Montevideo, Monterrey, Sao Paulo, Buenos Aires son parte del mundo latoc y es de prever que esta lista siga creciendo con las incorporaciones de nuevas ciudades: Praia, Medellín, Willemstad, Santiago y muchas otras.

Desde el inicio de los trabajos de diseño de Bazar, el equipo de desarrollo ha tenido muy presente el espíritu del mercado tradicional. Y es que el mercado tradicional no era sólo un lugar para la compraventa. Era también un espacio de interacción política y social y -se olvida demasiado a menudo- el lugar donde maestros, filósofos y jueces arbitraban conflictos y se encontraban con sus discípulos. El mercado no es exclusivamente una relación monetaria sino sobre todo una relación social.

Recogiendo ese espíritu se incorporó en la hoja de ruta de desarrollo de Bazar, junto al core, los módulos de rating, e-learning, arbitraje, mensajería interna, publicación de contenidos y muchos más.

Con nodos Bazar ya en funcionamiento empezamos a encontrarnos con nuevos módulos y/o incorporaciones al core que nos gustaría desarrollar. La última de estas incorporaciones es «Tesauro latoc». El objetivo de este módulo es eliminar barreras y zonas de sombra artificiales en el gran mercado generado por Bazar en el mundo latoc.

¿Pero de que zonas de sombras y barreras estamos hablando? Para dar respuesta a esta pregunta os voy a dejar un pequeño ejemplo. Imaginemos que entramos a bazar interesados en buscar opciones de carsharing y introducimos en el buscador «coche» para la opción de ofertas. Esta búsqueda nos devolvería todas la ofertas de los distintos nodos de Bazar que contengan la palabra «coche» pero nos dejaría fuera cualquier oferta con latocnimos como «carro» o «automóvel» utilizados por hablantes de otras variantes del latoc y hasta en la misma variante. Nos encontramos con zonas de sombra completamente artificiales cuando en el mundo latoc un hablante ya sea de portugués, gallego o papiamento podría comprender y defenderse perfectamente con una oferta publicada en español.

El primer impulso a la hora de querer eliminar estas zonas de sombras es recurrir a tesauros ya desarrollados en software libre pero nos encontramos con la siguiente realidad. Todos los tesauros disponibles funcionan sólo para una variante del latoc (español, portugués..) generando zonas de sombras artificiales en un espacio lingüístico único. La lógica del mundo puzzle y la reminiscencia del árbol o la red centralizada levantan barreras entre lenguas con un 89% de similitud léxica cuando por otro lado sugieren paridades del tipo español-ingles portugués-ingles. En la construcción de mercados a lo largo de todo el mundo latoc necesitamos herramientas que escapen a estas lógicas. Es así como nace «tesauro latoc», un proyecto pensado en principio para Bazar pero seguramente útil en muchas otras áreas dentro del mundo latoc.

Tesauro latoc: funcionalidad

  1. Devolver todos los latocnimos (sinónimos de cada una de las variantes del latoc) para una palabra.
  2. Para «coche»:

    auto, carreta, carromato, carruaje, automóvil, forcaz, automóvel, carro, veículo, viatura, outo

    Para «frigorífico»:

    heladera, nevera,fresquera,refrigerador,congelador,freezer, geladeira,refrigeradó, frigidaire, frigidel, frishidèr

El desarrollo y consolidación de un corpus de latocnimia (sinonimia dentro dentro del mundo latoc) es la tarea principal para a continuación programar las diferentes interfaces que implementen «Tesauro latoc». Afortunadamente existen ya buenos proyectos en este área y corpus de sinonimia libres de los que se puede partir.

Además de en Bazar ¿Donde? ¿En un buscador web latoc que nos de acceso de forma directa a una gran cantidad de contenidos en otras variantes latoc que en los buscadores tradicionales nos es opaca? ¿En el buscador de nuestro navegador de archivos de forma que una búsqueda no deje fuera documentos? ¿En proyectos de investigación y equipos de trabajo con campo de acción en todo el mundo latoc?.

«Tesauro latoc: eliminar zonas de sombra artificales en el mundo latoc» recibió 0 desde que se publicó el Sábado 5 de Noviembre de 2011 . Si te ha gustado este post quizá te gusten otros posts escritos por las Indias.

Deja un comentario

Si no tienes todavía usuario puedes crear uno, que te servirá para comentar en todos los blogs de la red indiana en la
página de registro de Matríz.