Selección de inputs y outputs en el análisis envolvente de datos: una metodología basada en el análisis multivariante.
.
Resumen
La selección de los inputs y outputs que entran en un modelo de Análisis Envolvente de Datos (DEA) es problemática. La eficiencia comparativa de cualquier unidad de decisión (DMU) depende de los inputs y outputs que entren en el modelo. Existe la tentación de hacer una reducción de datos basada en el estudio de las correlaciones. Pero la presencia o ausencia de variables altamente correlacionadas puede afectar las eficiencias calculadas de muchos DMUs. Por otra parte, la presencia de inputs u outputs que no se corresponden a la estructura lógica del sistema que se estudia puede hacer que algunos DMUs aparezcan como casos extremos en aspectos irrelevantes y parezcan ser eficientes por esa misma razón. Se han propuesto varios métodos para la selección de inputs y outputs, pero algunos no tienen un soporte teórico, mientras que otros dejan claro que dos modelos no difieren mucho en la estructura de las eficiencias calculadas pero no explican en qué modo son parecidos o diferentes. En este trabajo se presenta una metodología basada en la estimación de una multiplicidad de modelos, lo que genera una tabla de eficiencias por modelo y DMU. Esta tabla se estudia por medio del Análisis de Componentes Principales y otros métodos multivariantes que resultan en representaciones gráficas de los resultados. La metodología propuesta tiene varias ventajas: guía la selección de modelos en DEA, explica en qué modo dos modelos se parecen o se diferencian, explica porqué un mismo DMU adquiere distintas eficiencias bajo distintos modelos, visualiza los resultados, y produce un ordenamiento de DMUs incluso cuando los DMUs tienen 100% de eficiencia. Palabras clave: Análisis Envolvente de Datos, DEA, Estadística Multivariante, Selección de modelos en DEA.