I am trying to extract the title of this text, which is all in uppercase. I want to avoid a long dashed sequence and some acronyms like NOM-059-SEMARNAT 2010, of which may be some other ones to exclude. So I did a regex in python for a findall (with library re under python 2.'7.7, in spyder, windows8.1):
(?!(?:[- ]{2,}|NOM\-059\-SEMARNAT))([A-Z0-9ÁÉÍÓÚÑ:;¿\?\(\)\-\+\. ,]{10,})
A sample of the summaries document with this pattern I am scanning is this:
--------------------------------------------- Congreso Mexicano
RELACIÓN ENTRE EL TAMAÑO DEL FOROFITO Y LA RIQUEZA DE EPÍFITAS EN LOS PANTANOS DE CENTLA, TABASCO Dwers Aasrd Jxcxéas Lóasd1*, Rasdé de Jawdúz Rasdw Vasde1 Instituto de Ciencias Biologicas, Universidad de Ciencias y Artes de Chiapas awdsd.w@hlksajk.com Las plantas epífitas son poco comunes en manglares, no epífitas y las características de los forofitos de Rhizophora mangle, especie amenazada de acuerdo a la NOM-059-SEMARNAT 2010; en áreas conservadas de la reserva Pantanos de Centla, al noroeste de Tabasco. Se evaluó la relación entre La riqueza de epífitas estuvo significativamente relacionada con la cobertura de raíz y DAP de los forofitos. Las zonas I y III de los forofitos fueron las más similares y compartieron 47% del total de las especies. La zona I, que son las Palabras clave: Epífitas vasculares, distribución vertical, composición, Rhizophora mangle, raíces aéreas. ID: 96 lunes, 20 de abril de 2015, 3:30:00 PM, Sala: 8 Eje temático: Ecología de Comunidades
Aucun commentaire:
Enregistrer un commentaire