Sistemas de Recuperacion de Informacion: 05/01/2011

lunes, 16 de mayo de 2011

Memoria de Clase “Recuperación de información Modelos, sistemas y evaluación”

En clase de Recuperación de Información se hablo sobre lo importante de realizar la lectura del libro digital de Francisco Javier Martínez Méndez, específicamente el capitulo 3 “Evaluación de la Recuperación de información”. Teniendo en cuenta lo anterior, al hacer la lectura, se pueden destacar algunos puntos importantes para tener en cuenta en el momento de evaluar la recuperación de la información. Lo primero es destacar que por ser un tema relacionado con el servicio al usuario, es importante someter a prueba sus resultados y por ello existen métodos para evaluarlos.

Por lo anterior, se resaltan las medidas o métricas para lograr concluir la eficiencia del SRI, estas están acompañadas de ecuaciones que al ser reemplazadas por los datos reales de la búsqueda y recuperación de información arrojan un resultado que permiten establecer la utilidad de esta misma, teniendo en cuenta que es subjetiva muchas veces la respuesta, ya que la importancia de los documentos y archivos recuperados los analiza y verifica el usuario para determinar su grado de acertividad, que luego se representara con números para reemplazar en las ecuaciones y así obtener el resultado.

Ahora bien, para estas evaluaciones según el texto leído[1], se pueden utilizar medidas basadas en la relevancia de los documentos, otra en los usuarios y también en medidas alternativas a la realización de los juicios de relevancia. Dentro de cada una de las anteriores se encuentran métricas específicas con sus ecuaciones, algunas de ellas son: Cobertura, exhaustividad, precisión, selección, contenido, fallo, etc. Son herramientas al alcance de los usuarios que investigan, realizan estudios y trabajos de campo,; los cuales pueden evaluar si su proceso de búsqueda realizado por un SRI es eficiente o no y poder tomar decisiones al respecto para sus mejoras.

Publicado por: Nayive Galindo

[1] MARTÍNEZ, Méndez Francisco Javier. Recuperación de información Modelo, sistemas y evaluación. Evaluación de la Recuperación de información. [En línea-pdf]. Murcia: KIOSKO JMC, 2004. [Consulta: 10 de mayo de 2011]. p. 43. Disponible en: http://uvirtual.lasalle.edu.co/course/view.php?id=562

domingo, 8 de mayo de 2011

MEMORIA DE CLASE "SISTEMA DE RECUPERACIÓN DE INFORMACIÓN Y DATOS"

Los SRI de datos: su contenido es exacto, hace preguntas normalizadas, deductivas, plantea exactitud entre la pregunta a satisfacer, presenta un lenguaje artificial no ambiguo, tiene una especificación completa de los datos, frente a los errores puede corregirlos para que sea más exacta la respuesta, el tiempo de respuesta depende del soporte físico, algoritmo e índices.
Los SRI de información: la concordancia entre pregunta-respuesta es parcial y normalmente son difíciles de formalizar, la inferencia es inductiva, la relación entre la satisfacción del usuario evidencia un nivel de incertidumbre, el lenguaje de consulta es natural, especificación incompleta, respuesta al error totalmente insensible y subjetiva, rapidez de respuesta depende de la decisión del usuario.

RECUPERACIÓN DE INFORMACIÓN

El fin de la información es ser consultada por la gran mayoría de usuarios posibles con el fin de lograr una respuesta adecuada que satisface las necesidades informacionales de las personas, el usuario al localizar la información determina su relevancia.

Extracción de Información

Es aquella búsqueda manual o automática de palabras, párrafos o trozos de textos que contengan información relevante a una pregunta o respuesta bien estructurada para el usuario, la recuperación de información presenta aspectos estructurados o no de la información por eso es necesario establecer mecanismos de búsqueda adecuados para lograr que las maquinas interpreten lo que deseamos encontrar al momento de buscar, Google es un metabuscador que entiende rápidamente que es lo que el usuario está buscando, a la vez hace correcciones ortográficas o de sintaxis, y establece un ranking de las respuestas, y de la documentación, información o datos que son de importancia según el criterio de búsqueda que haya tenido el usuario en su consulta.

Lenguaje natural humano: se refiere al lenguaje que empleamos a diario los humanos para poder comunicarnos

Ventajas : El usuario lo comprende, pues puede expresar cualquier significado.

Tolerante a fallos.
Desventajas:

No es conciso

Es ambiguo

Es difícil que lo interprete el computador.

Es subjetivo.

Lenguaje natural restringido: presenta terminología controlada es un subconjunto del lenguaje natural, como ejemplo están los tesauros las taxonomías las listas de encabezamiento de materias.

Ventajas:

Restringe las búsquedas, y es más fácil interpretar la información.

Inconvenientes

Se debe determinar la forma de restricción de las búsquedas, pues no facilitaría el acceso a un texto completo o a la información suficiente que necesita el usuario.

Es incomodo en el momento de buscar puesto que no se identifican con el método de búsqueda y el lenguaje de expresión de las búsquedas.

Lenguaje artificial *(Lenguaje Informático): es la información compacta y limitada, está compuesto por vocabulario limitado y por unas reglas sintácticas muy claras que no permiten ambigüedades.

Publicado por: Paola Hernández

Gómez Dueñas, Laureano F. Material de clase: Recuperación de información y de datos consultado: (2011, mayo 8). En línea.

MEMORIA DE CLASE "INDIZACION "

Es la aplicación de tablas a los datos, con el fin de hacer más rápida y flexible la recuperación de la información y poder acceder a cada uno de sus elementos. Indizar es definir un código para ejecutar el acceso a la información, el cual le da estructura a los datos y un acceso más eficaz, para esto se debe dar una representación alterna a partir de términos o palabras que contienen los documentos a recuperar.

Índices: los índices ayudan a hacer un seguimiento del contenido de los documentos, estos consisten en sustituir el contenido por un conjunto de términos que los representan.

Estructura de un índice: permite realizar operaciones de búsqueda mediante técnicas que comparan los enunciados que han utilizado los usuarios con los términos almacenados en los índices del sistema. Dentro de dicha estructura de índices encontraremos ítems como palabras clave, autor, formato, títulos que identifican los documentos, etc.

Publicado por: Paola Hernández

Gómez Dueñas, Laureano Felipe. Introducción a la recuperación de información clase Nro. 2. “indización”.

MEMORIA DE CLASE “POSICIONAMIENTO DEL BLOG”

(“Recuperación de Información” AND “Programa de Sistemas de Información” AND “Universidad de La Salle” AND 2011 AND Colombia AND Google AND posicionamiento AND Grupo20)

Para la debida publicación de entradas en nuestro blog es muy importante tener en cuenta los siguientes tips:

AUTENTICIDAD DE LA INFORMACIÓN: que tan viable es acceder a la información que subimos al blog.

Factores internos:

·         Manipulación concreta
·         Denominación de la URL
·         Publicación del contenido

Factores externos: examinar si:

· ¿Ese blog pública contenido importante?

· ¿Tenemos manejo de ello?
· ¿Los enlaces que ese sitio está publicando tienen contenido rico en información?

PAGE RAM: http://www.mipagerank.com/ en esta página podremos medir la popularidad en internet sobre un tema determinado de nuestro blog.

MOTORES DE BÚSQUEDA

Recupera dentro de los documentos, Información relevante a una consulta, busca en las páginas web y hace índices.

INDICE DIRECTO: en el cual debemos tener en cuenta

·         Quien tiene control de la información que está recuperando
·         Cada cuanto y quien esta detrás del manejo de la pagina web
·         Identificar palabras claves dentro de los documentos, para hacer posible
una lista que dará el nivel de relevancia de las consultas, de acuerdo a esas
palabras clave se creara el contenido.

LAS MALAS PRÁCTICAS EN BLOGGER

· Es esencial no repetir la información pues esto genera que Google identifique esa información y genere spam.

· El uso inadecuado de las palabras clave, es importante definir cuáles serán y mantenerlas en el tiempo, para posibles recuperaciones.

DOMINIOS: esta parte se definió así el bloplop es un dominio y blog es un subdominio de este. Es importante puesto que si algo cambia en la URL pierde la antigüedad de su contenido y de su blog.

Contenido: este debe ser coherente y alternativo, debe tener afinidad con las palabras clave y no perder el objetivo de la temática.

Publicar 3 veces por semana, párrafos de 3 a 4 renglones, para que google empiece a identificar los sitios de contenido nuevo y constante.

Ojo: la citación es indispensable a la hora de subir información, en este caso es mejor parafrasear, nombrar al autor y si hay link hacer en enlace, ya que el contenido debe ser original y no copiar y pegar.

Jerarquía a los títulos: lo que esta resaltado es importante para los consultantes.

Mitos sobre el blog: el blog no se posiciona con visitas ni seguidores, los diseños hacen demorada la carga del blog, ojo con las entradas las idea es que el usuario se aprenda el url para ingresar.

Publicado por: Paola Hernández

Triana, B. Iván. Clase tutorial: Malas prácticas en su blog. Febrero de 2011.

domingo, 1 de mayo de 2011

Memoria de Clase” METABIBLIOTECA”

(“Recuperación de Información” AND “Programa de Sistemas de Información” AND “Universidad de La Salle” AND 2011 AND Colombia AND Google AND posicionamiento AND Grupo20)

Es importante mencionar que llevamos varias clases trabajando en este proyecto tan interesante cuyo objetivo es recopilar documentos electrónicos que contengan bibliotecas virtuales, bibliotecas digitales, bibliotecas electrónicas, colecciones digitales, documentos digitales, ovas, centros de documentación y varios recursos electrónicos.

El objetivo es recopilar información de un país específico a través de enlaces del país, que proporcionen contenidos de información. Metabiblioteca es un proyecto con mucho futuro puesto es un recurso de información que fomenta la investigación, la búsqueda de fuentes documentales digitales, y la aplicación de técnicas de recuperación de información.

El resultado esperado de metabilblioteca consiste en consolidar a través de un metabuscador fuentes de información de contenido académico en sistemas de información; de varios países de Latinoamérica entre otros. Sin duda es una herramienta la cual proporcionara a quien la consulte fuentes de información enriquecedoras, acerca de los temas documentales, las cuales permitirán ampliar la visión global de la información y los recursos electrónicos.

Imagen 1 Google Imágenes Día Internacional del Libro. Disponible En: http://www.juntadeandalucia.es/averroes/sanwalabonso/wqyct/ct_diadellibro/23deabril.htm

Publicado Por: Dayssi Ibarguen.

Sistemas de Recuperacion de Informacion

Buscar este blog

lunes, 16 de mayo de 2011

Memoria de Clase “Recuperación de información Modelos, sistemas y evaluación”

domingo, 8 de mayo de 2011

MEMORIA DE CLASE "SISTEMA DE RECUPERACIÓN DE INFORMACIÓN Y DATOS"

MEMORIA DE CLASE "INDIZACION "

MEMORIA DE CLASE “POSICIONAMIENTO DEL BLOG”

domingo, 1 de mayo de 2011

Memoria de Clase” METABIBLIOTECA”

SEGUIDORES

ARCHIVO DEL BLOG

creativecommons