Laboratorio de Lenguaje Natural y Procesamiento de Texto
Fundado en 1996 2 doctores miembros SNI nivel 2 y miembros de AMC 10+ estudiantes, 10+ graduados 400+ publicaciones, 50+ proyectos 30+ congresos organizados Jefe: Dr. Alexander Gelbukh Contacto: véase www.Gelbukh.com. |
Datos de 2003; algunos actualizados en 2009
Véase datos más
actualizados |
El Laboratorio desarrolla nuevas técnicas y herramientas computacionales para el procesamiento automático de los textos escritos en el lenguaje natural, sobre todo, en español.
Las principales aplicaciones de tales técnicas son:
· Búsqueda en Internet y el manejo de conocimiento en forma textual
· Manejo inteligente de documentos
· Interfaces humano-computadora en lenguaje natural
· Traducción automática entre los lenguajes humanos
· Extracción de información de Internet y cantidades grandes de textos
· Comprensión del lenguaje natural por computadora
Considerando que en la sociedad de la información, el desarrollo de las herramientas para el procesamiento computacional del lenguaje nacional –el español– es indispensable para la independencia cultural de la Nación y como el apoyo tecnológico a la democracia, educación y acceso público a la información.
Actuales:
|
|
|
Dr. Igor |
||
Jefe, Profesor Titular “C” |
Profesor Titular “C” |
Maestro Honorario |
SNI nivel 2 |
SNI nivel 2 |
ex SNI nivel 3 |
Miembro de la Academia |
Miembro de la Academia |
(jubilado) |
Pasados:
|
|
Dr. Mikhail |
Dra. Sofía |
ex Profesor |
Estancia |
|
SNI nivel I |
|
|
Esta página muestra sólo nuestros primeros graduados. Véase más información en la página del Dr. Gelbukh, Véase algunos de los premios que recibieron nuestros estudiantes.
|
|
|
|
|
Dra. Sofía |
M. en C. Liliana |
M. en C. Roberto Jurado Jiménez |
M. en C. Gabriela Rivera Loza |
|
En estancia posdoctoral en el CIC, IPN |
Profesor |
Profesora del IPN |
Investigador del IMP |
Investigadora en el INBA, DF |
SNI nivel 1 |
SNI nivel 1 |
|
|
|
Los datos aquí no son actualizados (sólo se muestran los datos hasta 2003). Desde 1997 hasta 2003 el Laboratorio ha liderado o está liderando los proyectos:
· Nacionales, apoyados por el CONACyT: 7
· Nacionales, apoyados por el REDII-CONACyT: 2
· Institucionales, apoyados por el CGPI-IPN: 22
· Vinculados, apoyados por el Senado de la República: 1
· Internacionales: 2
En los proyectos de investigación básica, se desarrollan nuevos métodos de procesamiento de texto en español y los recursos léxicos (diccionarios computacionales, gramáticas, corpus textuales) que los complementan.
En los proyectos aplicados se desarrollan las herramientas y sistemas para el manejo de documentos, la búsqueda en los acervos grandes de textos y bases de datos documentales, la clasificación y agrupamiento de documentos, entre otras.
Ejemplo: Buscador Inteligente para la Base de Datos de documentos legales del Senado de la República Mexicana.
El Laboratorio está interesado en los proyectos aplicados vinculados con las empresas o instituciones gubernamentales, que permitan la implantación de alta tecnología en el procesamiento automático de textos en español. Por ejemplo:
Búsqueda y recuperación de información. Ayudar a los usuarios a encontrar los documentos necesarios en bases grandes de textos, usando sinónimos, conceptos, campos, etc. Los diccionarios se ajustan a la problemática del cliente.
Manejo inteligente de documentos. Automáticamente clasificar y agrupar los documentos en bases y flujos grandes. Turnar el documento a la persona correspondiente. Presentar una vista general del conjunto de documentos y ayudar en la búsqueda.
Acceso a bases de datos en el lenguaje natural. Permitir las preguntas a las bases de datos del cliente, en el español. Lo que permite usar estas bases a las personas sin conocimientos técnicos en computación y al público general (p.ej., publicarlas en Internet).
Extracción de información y minería de texto. Crear bases de datos a partir de análisis de cantidades grandes de texto, p.ej., de Internet. Ayudar en la toma de decisiones a través de detección de tendencias y anomalías en los flujos de documentos (noticias).
Cursos y tesis
El Laboratorio imparta los siguientes cursos en los programas de Maestría y Doctorado:
· Tratamiento de Lenguaje Natural
· Lingüística Aplicada I: Introducción a Lingüística Aplicada
· Lingüística Aplicada II: Sistemas de Aplicación Lingüística
· Lingüística Aplicada III: Procesamiento Inteligente de Texto
· Temas Selectos de la Computación: Recuperación de Información Textual
Los cursos conducen al estudiante desde las nociones básicas del procesamiento de texto hasta los problemas actuales de la lingüística computacional, tales como:
· El análisis sintáctico y los formalismos computacionales,
· La resolución de anáfora estándar e indirecta,
· La resolución de la ambigüedad de sentidos de palabras,
· Las representaciones semánticas, ente otros.
En estos temas se concentra también la investigación que se lleva a cabo en el Laboratorio a través de los trabajos de tesis doctoral y de Maestría.
Véase aquí una lista de las publicaciones del laboratorio.
Desde 1997 hasta 2003 el Laboratorio ha publicado 232 trabajos de investigación en el área de la lingüística computacional:
· Indexadas por el Citation Index: 36
· En revistas de excelencia reconocidas por el CONACyT: 6
· En otras revistas internacionales: 22
· Libros escritos y editados: 7
· Capítulos en libros de investigación: 9
· En colecciones de Selected Papers: 14
· En congresos internacionales publicados por IEEE: 10
· En otros congresos internacionales: 74
· En congresos nacionales: 21
· Informes técnicos con ISBN: 31
· En revistas de divulgación: 2
En una parte considerable de éstos estudiantes del Laboratorio son coautores.
Congresos y labor editorial
Véase aquí una lista algunos de los congresos en la organización de los cuales ha participado el Laboratorio.
Una de las actividades importantes del Laboratorio es la organización o participación en la organización de congresos nacionales e internacionales, así como participación en la labor editorial de las revistas científicas:
El Laboratorio fundó y organiza anualmente desde el 2000 el Congreso Internacional CICLing (www.CICLing.org), las memorias del cual son publicadas por la casa editorial mundialmente reconocida Springer-Verlag.
Actualmente el Laboratorio organiza el congreso nacional de las ciencias de la computación CORE.
Los investigadores del Laboratorio han participado, como jefe o miembro del Comité de Programa, en la organización de varios congresos internacionales en los EE.UU., Alemania, España, Rep. Checa, Bulgaria, China, México, Paraguay, Tunisia, Rusia, entre otros.
Los investigadores del Laboratorio fungen como miembros del Consejo Editorial de varias revistas de alto prestigio editadas en México y EE.UU.
El Laboratorio mantiene estrechas relaciones de colaboración con diversos grupos a nivel internacional:
· Representa oficialmente al Instituto ante la Red Iberoamericana RITOS-2 compuesta de los grupos de 14 países.
· Tiene convenios de colaboración con varias instituciones rusas; colabora con los especialistas de estas instituciones en la elaboración de los proyectos.
· Colabora con los expertos de 12 países en la organización de los congresos de la serie CICLing.
· Colabora con los expertos de Japón y China en la edición de la revista Asian Information Science Life y organización del congreso NLPKE.
· Tiene el equipo internacional de investigadores y estudiantes, con los representantes de México, Rusia y Cuba.
· Mantiene contactos regulares con los grupos más importantes en su área en los EE.UU., Inglaterra, España, Alemania, Japón, Rusia.
Véase información más actualizada en el sitio del laboratorio.