SPSS

Ajustar Compartir Imprimir Citar
Software de análisis estadístico

SPSS Statistics es un paquete de software estadístico desarrollado por IBM para la gestión de datos, análisis avanzado, análisis multivariante, inteligencia comercial e investigación criminal. Producido durante mucho tiempo por SPSS Inc., fue adquirido por IBM en 2009. Las versiones del software lanzadas desde 2015 tienen la marca IBM SPSS Statistics.

El nombre del software originalmente significaba Paquete estadístico para las ciencias sociales (SPSS), reflejando el mercado original, luego cambió a Soluciones de productos y servicios estadísticos .

Resumen

SPSS es un programa ampliamente utilizado para el análisis estadístico en ciencias sociales. También es utilizado por investigadores de mercado, investigadores de salud, empresas de encuestas, gobierno, investigadores de educación, organizaciones de marketing, mineros de datos y otros. El manual original de SPSS (Nie, Bent & Hull, 1970) ha sido descrito como uno de los libros de "sociología'más influyentes" por permitir que los investigadores ordinarios hagan su propio análisis estadístico. Además del análisis estadístico, la gestión de datos (selección de casos, remodelación de archivos y creación de datos derivados) y la documentación de datos (se almacena un diccionario de metadatos en el archivo de datos) son características del software base.

Se puede acceder a las numerosas funciones de SPSS Statistics a través de menús desplegables o se pueden programar con un lenguaje de sintaxis de comandos patentado de 4GL. La programación de sintaxis de comandos tiene los beneficios de una salida reproducible, simplifica las tareas repetitivas y maneja análisis y manipulaciones de datos complejos. Además, algunas aplicaciones complejas solo pueden programarse en sintaxis y no son accesibles a través de la estructura del menú. La interfaz del menú desplegable también genera sintaxis de comandos: esto se puede mostrar en la salida, aunque la configuración predeterminada debe cambiarse para que la sintaxis sea visible para el usuario. También se pueden pegar en un archivo de sintaxis usando la opción "pegar" botón presente en cada menú. Los programas se pueden ejecutar de forma interactiva o desatendida, utilizando la función de trabajo de producción suministrada.

Una "macro" language se puede utilizar para escribir subrutinas de lenguaje de comandos. Una extensión de programabilidad de Python puede acceder a la información en el diccionario de datos y los datos y crear dinámicamente programas de sintaxis de comandos. Esta extensión, introducida en SPSS 14, reemplazó los "scripts" menos funcionales de SAX Basic. para la mayoría de los propósitos, aunque SaxBasic permanece disponible. Además, la extensión de Python permite que SPSS ejecute cualquiera de las estadísticas del paquete de software gratuito R. Desde la versión 14 en adelante, SPSS puede controlarse externamente mediante un programa de Python o VB.NET mediante los "complementos"suministrados. 34;. (Desde la versión 20 en adelante, estas dos funciones de secuencias de comandos, así como muchas secuencias de comandos, se incluyen en los medios de instalación y normalmente se instalan de forma predeterminada).

SPSS Statistics impone restricciones en la estructura interna de los archivos, los tipos de datos, el procesamiento de datos y los archivos coincidentes, lo que en conjunto simplifica considerablemente la programación. Los conjuntos de datos de SPSS tienen una estructura de tabla bidimensional, donde las filas normalmente representan casos (como individuos u hogares) y las columnas representan mediciones (como edad, sexo o ingresos familiares). Solo se definen dos tipos de datos: numéricos y de texto (o "cadena"). Todo el procesamiento de datos ocurre secuencialmente caso por caso a través del archivo (conjunto de datos). Los archivos se pueden emparejar uno a uno y uno a muchos, pero no muchos a muchos. Además de esa estructura y procesamiento de casos por variables, hay una sesión Matrix separada donde uno puede procesar datos como matrices usando operaciones de álgebra lineal y de matrices.

La interfaz gráfica de usuario tiene dos vistas que se pueden alternar. La 'Vista de datos' muestra una vista de hoja de cálculo de los casos (filas) y variables (columnas). A diferencia de las hojas de cálculo, las celdas de datos solo pueden contener números o texto, y las fórmulas no se pueden almacenar en estas celdas. La 'Vista de variables' muestra el diccionario de metadatos, donde cada fila representa una variable y muestra el nombre de la variable, la etiqueta de la variable, la(s) etiqueta(s) de valor, el ancho de impresión, el tipo de medida y una variedad de otras características. Las celdas en ambas vistas se pueden editar manualmente, definiendo la estructura del archivo y permitiendo la entrada de datos sin usar la sintaxis de comandos. Esto puede ser suficiente para pequeños conjuntos de datos. Los conjuntos de datos más grandes, como las encuestas estadísticas, se crean con mayor frecuencia en el software de ingreso de datos, o se ingresan durante entrevistas personales asistidas por computadora, mediante escaneo y uso de software de reconocimiento óptico de caracteres y reconocimiento óptico de marcas, o mediante captura directa de cuestionarios en línea. Estos conjuntos de datos luego se leen en SPSS.

SPSS Statistics puede leer y escribir datos de archivos de texto ASCII (incluidos archivos jerárquicos), otros paquetes estadísticos, hojas de cálculo y bases de datos. También puede leer y escribir en tablas de bases de datos relacionales externas a través de ODBC y SQL.

La salida estadística tiene un formato de archivo patentado (archivo *.spv, compatible con tablas dinámicas) para el cual, además del visor integrado, se puede descargar un lector independiente. La salida patentada se puede exportar a texto o Microsoft Word, PDF, Excel y otros formatos. Alternativamente, la salida se puede capturar como datos (usando el comando OMS), como texto, texto delimitado por tabuladores, PDF, XLS, HTML, XML, conjunto de datos SPSS o una variedad de formatos de imágenes gráficas (JPEG, PNG, BMP y EMF).

El logo SPSS utilizado antes de la renombre en enero de 2010.

Existen varias variantes de SPSS Statistics. SPSS Statistics Gradpacks son versiones con grandes descuentos que se venden solo a estudiantes. SPSS Statistics Server es una versión del software con una arquitectura cliente/servidor. Los paquetes complementarios pueden mejorar el software base con características adicionales (los ejemplos incluyen muestras complejas, que pueden ajustarse para muestras agrupadas y estratificadas, y tablas personalizadas, que pueden crear publicación- mesas preparadas). SPSS Statistics está disponible con una licencia de suscripción anual o mensual.

La versión 25 de SPSS Statistics se lanzó el 8 de agosto de 2017. Esto agregó estadísticas nuevas y avanzadas, como resultados de soluciones de efectos aleatorios (GENLINMIXED), errores estándar sólidos (GLM/UNIANOVA) y gráficos de perfil con barras de error dentro de Advanced Complemento de estadísticas y tablas personalizadas. V25 también incluye nuevas capacidades de estadísticas bayesianas, un método de inferencia estadística y gráficos listos para publicación, como nuevas y potentes capacidades de gráficos, que incluyen nuevas plantillas predeterminadas y la capacidad de compartir con aplicaciones de Microsoft Office.

Versiones e historial de propiedad

SPSS se lanzó en su primera versión en 1968 como paquete estadístico para las ciencias sociales (SPSS) después de que lo desarrollaran Norman H. Nie, Dale H. Bent y C. Hadlai Hull. Esos directores se incorporaron como SPSS Inc. en 1975. Las primeras versiones de SPSS Statistics se escribieron en Fortran y se diseñaron para el procesamiento por lotes en mainframes, incluidas, por ejemplo, las versiones de IBM e ICL, que originalmente usaban tarjetas perforadas para la entrada de datos y programas. Una ejecución de procesamiento lee un archivo de comandos de SPSS y un archivo de entrada sin procesar de datos de formato fijo con un solo tipo de registro, o un 'getfile' de datos guardados por una ejecución anterior. Para ahorrar un valioso tiempo de computadora, un 'edit' run podría hacerse para verificar la sintaxis del comando sin analizar los datos. A partir de la versión 10 (SPSS-X) en 1983, los archivos de datos podían contener varios tipos de registros.

Antes de SPSS 16.0, había diferentes versiones de SPSS disponibles para Windows, Mac OS X y Unix.

SPSS Statistics versión 13.0 para Mac OS X no era compatible con computadoras Macintosh basadas en Intel, debido a que el software de emulación de Rosetta provocaba errores en los cálculos. SPSS Statistics 15.0 para Windows necesitaba instalar una revisión descargable para ser compatible con Windows Vista.

A partir de la versión 16.0, la misma versión se ejecuta en Windows, Mac y Linux. La interfaz gráfica de usuario está escrita en Java. La versión de Mac OS se proporciona como un binario universal, lo que la hace totalmente compatible con hardware PowerPC y Mac basado en Intel.

SPSS Inc anunció el 28 de julio de 2009 que IBM la iba a adquirir por 1200 millones de dólares. Debido a una disputa sobre la propiedad del nombre "SPSS", entre 2009 y 2010, el producto se denominó PASW (Software de análisis predictivo). A partir de enero de 2010, se convirtió en "SPSS: An IBM Company". La transferencia completa del negocio a IBM se realizó el 1 de octubre de 2010. Para esa fecha, SPSS: An IBM Company dejó de existir. IBM SPSS ahora está completamente integrado en IBM Corporation y es una de las marcas de la cartera de análisis empresarial de IBM Software Group, junto con IBM Algorithmics, IBM Cognos e IBM OpenPages.

Software complementario en "IBM SPSS" se utilizan para minería de datos y análisis de texto (IBM SPSS Modeler) y servicios de puntuación de crédito en tiempo real (IBM SPSS Collaboration and Deployment Services).

SPSS Data Collection y SPSS Dimensions se vendieron en 2015 a UNICOM Systems, Inc., una división de UNICOM Global, y se fusionaron en el paquete de software integrado UNICOM Intelligence (diseño de encuestas, implementación de encuestas, recopilación de datos, gestión de datos e informes).

IDA (Análisis de datos interactivos)

IDA (Análisis de datos interactivos) era un paquete de software que se originó en lo que antes era el Centro Nacional de Investigación de Opinión (NORC), en la Universidad de Chicago. Ofrecido inicialmente en el HP-2000, un poco más tarde, bajo la propiedad de SPSS, también estaba disponible en el DECSYSTEM-20 de DEC. El análisis de regresión fue uno de los puntos fuertes de IDA.

SCSS - SPSS conversacional/columnar

SCSS era un producto de software destinado al uso en línea de mainframes de IBM.

Aunque el "C" era para Conversational, también representaba una distinción con respecto a cómo se almacenaban los datos: usaba una base de datos orientada a columnas en lugar de orientada a filas (interna).

Esto proporcionó un buen tiempo de respuesta interactivo para el Sistema estadístico conversacional (SCSS) de SPSS, cuyo punto fuerte, al igual que con SPSS, era la tabulación cruzada.

Proyecto NX

En octubre de 2020, IBM anunció el inicio de un programa de acceso anticipado para el "Nuevo SPSS Statistics", cuyo nombre en código es Proyecto NX. Contiene "muchos de sus programas favoritos Funciones de SPSS presentadas en una nueva interfaz fácil de usar, con orientación integrada, varias pestañas, gráficos mejorados y mucho más.

En diciembre de 2021, IBM abrió el Programa de acceso anticipado para la próxima generación de SPSS Statistics para más usuarios y compartió más imágenes al respecto.