Computed Author en PubMed
Categorías:
El nuevo diseño de PubMed ya está aquí y también sus novedades en cuanto a su algoritmo de búsqueda. Ya en noviembre del año pasado hice un repaso de los primeros cambios que se anunciaron.
Aquí os dejo un recordatorio a modo de repaso rápido sobre la búsqueda que hace PubMed: cuando introducimos un término o frase en la caja de búsqueda de PubMed, éste aplica el Automatic Term Mapping (ATM), que consiste en una traducción del término según unas tablas predefinidas. Hace la comparación del término en cada una de las tablas y para el ATM en cuanto localiza una coincidencia. La primera tabla es Subject Translation Table (como novedad: comprueba nuestro término según grafía británica y americana, busca sus singulares y plurales; además de lo de siempre: añade sinónimos, busca su MeSH, subheadings, publication types…). La segunda tabla es Journals Translation Table (comprueba que el término se corresponde con el título o issn de una revista). Por último compara el término con la Authors Translation Table.
Me quiero detener en la parte de los autores. PubMed recoge un índice de autores desde 1946 con el formato apellido<espacio>inicial del nombre. A partir del año 2002 empieza a recoger también la forma desarrollada del nombre (apellido completo y nombre completo, no sólo la inicial). Por esta razón, cuando hacemos una búsqueda en PubMed y seleccionamos la opción de visualización Abstract, vemos que los nombres de los autores están desarrollados (siempre que los artículos sean posteriores a 2002).
La forma más efectiva de buscar un autor es por el formato antiguo de apellido<espacio>inicial del nombre, porque de esa forma nos aseguramos de recuperar también los artículos anteriores a 2002. Otra forma de buscar es pinchando sobre el autor que nos interesa y que vemos listado en una referencia. Esto provocará que PubMed nos muestre una página de resultados con todos los artículos que considera que corresponden a este autor seleccionado. ¿Y cómo sabe PubMed que un apellido e inicial se corresponde con un autor en concreto y no con otro con el que comparte esos datos?
Computed Author
Esta funcionalidad la introdujo PubMed en 2012 y pretende ayudar a la desambiguación de los nombres comunes de los autores. Si PubMed encuentra un nombre de autor análogo para otras citas, ésas se mostrarán en primer lugar por orden de importancia, seguida de citas no similares. El proceso de desambiguación compara las citas con el mismo nombre de autor. La similitud de cada par de citas es medida por los metadatos de ambas citas (coautores, revistas, afiliación…) Las citas que comparten nombres de autores similares se dividen en diferentes grupos agrupando las citas que son muy similares entre sí. Las citas dentro de cada grupo se clasifican como pertenecientes al mismo autor. Esto empezó a implementarse en 2012, coincidiendo con la aparición de ORCID. Si el id de ORCID está incluido en los metadatos, será información que usará PubMed para desambiguar y poder ofrecer todos los artículos de un autor cuando se hace la búsqueda. ¿Qué conclusiones sacamos de esto? Primero, que todos los autores deberían tener un perfil en ORCID y firmar siempre igual. Segundo, que todos los editores deberían pedir el id de ORCID a los autores que publiquen en sus revistas. Tercero, que estos editores deberían incluir este dato dentro de los metadatos del archivo que se envía a PubMed para su indexación.
Durante estos primeros meses del año en el que PubMed hacía ajustes en su nueva interfaz, me topé de casualidad con la opción Computed Author dentro del apartado de ordenación de resultados. Supongo que estarían haciendo pruebas porque finalmente no dejaron la opción en el desplegable (entiendo que después de seleccionar esa opción habría que ordenar por orden alfabético ascendente o descendente), pero sí me dio tiempo a sacar un pantallazo: