Escuela de Ciencias de la Computación e Informatica
CI-2414 Recuperación de Información
La mayor parte de los modelos y técnicas empleados en Recuperación de la Información utilizan en algún momento recuentos de frecuencias de los términos que aparecen en los documentos y en las consultas. Normalizar estos términos adecua dicho recuento.
Existen algoritmos para lematizar automĆ”ticos y manuales. Dentro de los automĆ”ticos se encuentra āBusqueda en Tablaā, āEliminacion de Afijosā, āVariedad de Sucesoresā y āN-Gramasā.
La indexación gracias a estas tĆ©cnicas se hace de forma mĆ”s rĆ”pida. ĀSe reduce el tamaƱo del Ćndice hasta un 50%. ĀAumenta la eficiencia. Pero en el Web no se usa, ya que existen muchos idiomas.

"Lematización"
