Estudio y selección de las técnicas SIFT, SURF y ASIFT de reconocimiento de imágenes para el diseño de un prototipo en dispositivos móviles
Las técnicas de visión por computador son una subdivisión de la inteligencia artificial, mediante la cual usando una imagen, un grupo de imágenes o una secuencia de imágenes, tenemos la posibilidad de extraer información importante para realizar diversas operaciones como: reconocimiento de objetos,...
Autor Principal: | Plaza Cordero, Andrea Maricela |
---|---|
Otros Autores: | Zambrano Martínez, Jorge Luis |
Formato: | bachelorThesis |
Idioma: | spa |
Publicado: |
2012
|
Materias: | |
Acceso en línea: |
http://dspace.ups.edu.ec/handle/123456789/1259 |
Etiquetas: |
Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
|
Sumario: |
Las técnicas de visión por computador son una subdivisión de la inteligencia artificial, mediante la cual usando una imagen, un grupo de imágenes o una secuencia de imágenes, tenemos la posibilidad de extraer información importante para realizar diversas operaciones como: reconocimiento de objetos, calibración de la cámara, modelado 3D, visión robótica, seguimiento de video, tratamiento de imágenes (contraste, brillo, umbral, etc.), entre otros.
Existen muchos campos en los que se pueden usar como: rayos x, tomografía, infrarrojos, sensores ópticos, sensores de rangos, meteorología, robótica, entre otros.
En la actualidad existen diversos métodos usados en el reconocimiento de imágenes, algunos con mayor o menor precisión. SIFT es un algoritmo para detectar y describir las características locales en las imágenes, fue descubierto por David Lowe en 1999, por lo tanto es una técnica bastante joven; pero en si no es el único método, otra técnica que también llama la atención es SURF, un método inspirado en SIFT que se presentó en el 2006, pero que trae una nueva funcionalidad: su rapidez.
La técnica a ser usada para el reconocimiento es ASIFT, ya que a diferencia del método SIFT que solo simula tres parámetros, ahora con ASIFT se simulan seis parámetros: el zoom, el ángulo de la cámara en latitud, el ángulo de la cámara en longitud y normaliza los otros 3 parámetros que son, la traslación, rotación y escala.
La aplicación empezará dando una bienvenida a las personas no videntes, usando un asistente auditivo, luego deberá únicamente tocar la pantalla en cualquier punto del dispositivo móvil y este capturará una imagen, el cual luego será procesado usando metodología de visión artificial, el cual responderá de forma auditiva (denominación del billete). Presentará la opción de cambio de idioma, facilitando que su uso sea para personas no videntes que hablen o conozcan los dos idiomas principales (español, inglés). |
---|