Manual del usuario de SAP Predictive Analysis SAP Predictive Analysis

SAP Predictive Analysis
Document Version: 1.15 - 2014-02-03
Manual del usuario de SAP Predictive
Analysis
Tabla de contenidos
1
Recursos de documentación de SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5
2
Novedades de SAP Predictive Analysis 1.15. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3
Acerca de este manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7
3.1
Ámbito de este manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2
Audiencia de destino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4
Información general de SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
5
Instalar SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
5.1
Requisitos previos de instalación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
5.2
Usar el programa de instalación de SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
5.2.1
5.3
Instalar SAP Predictive Analysis usando el programa de instalación. . . . . . . . . . . . . . . . . . . . . 9
Realizar una instalación sin supervisión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.3.1
Realizar una instalación sin supervisión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.4
Configurar registros de seguimiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.5
Para desinstalar SAP Predictive Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.6
Consideraciones importantes para usar SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.6.1
Para configurar _SYS_REPO para el usuario de SAP Predictive Analysis. . . . . . . . . . . . . . . . . 15
5.6.2
Indicadores OLAP admitidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5.6.3
Obtener privilegios de esquema para acceder al origen de datos de HANA en línea. . . . . . . . . 15
5.6.4
Privilegios para ejecutar algoritmos PAL con la biblioteca de funciones de aplicación (AFL)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.7
Consideraciones importantes para usar universos de SAP BusinessObjects. . . . . . . . . . . . . . . . . . . . . 16
6
Instalación y configuración de R en código abierto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.1
Instalar R-3.0.1 y los paquetes necesarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.2
Configurar R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.3
Consideraciones importantes para el uso de SAP Predictive Analysis con algoritmos R en el modo
online de SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
7
Introducción a SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
7.1
Conocimientos básicos de SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
7.2
Iniciar SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
7.3
Comprender SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
7.3.1
Vista Diseñador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.3.2
Vista Resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
7.4
Usar SAP Predictive Analysis del principio al final. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8
Crear análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
8.1
Crear un análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Tabla de contenidos
8.1.1
Adquirir datos de un origen de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
8.1.2
Preparar los datos para el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
8.1.3
Aplicar algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
8.1.4
Almacenar resultados del análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
8.2
Ejecutar el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
8.3
Guardar el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
8.4
Eliminación de análisis desde el documento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
8.5
Ver resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29
9
Adding Custom Component. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
9.1
Asistente de creación de componentes R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
9.2
Crear un componente R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
10
Analizar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
10.1
Gráficos de visualización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
10.1.1
Gráfico de matriz de dispersión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38
10.1.2
Gráfico de resumen estadístico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38
10.1.3
Coordenadas paralelas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
10.1.4
Árbol de decisiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
10.1.5
Gráfico de tendencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41
10.1.6
Gráfico de clúster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
10.1.7
Gráfico de nube de etiquetas a priori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
10.1.8
Matriz de confusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
11
Crear gráficos para visualizar los datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .45
12
Crear guiones para sus datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
13
Compartir gráficos y conjuntos de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
14
Trabajar con modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
14.1
Crear un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
14.2
Exportar un modelo como PMML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
14.3
Exportar un modelo a un archivo .spar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49
14.4
Exportar un modelo PAL de SAP HANA como procedimiento almacenado. . . . . . . . . . . . . . . . . . . . . . 49
14.4.1
Eliminar el procedimiento almacenado exportado de SAP HANA. . . . . . . . . . . . . . . . . . . . . . 50
14.5
Importar un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50
14.6
Eliminar un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
15
Propiedades de los componentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
15.1
Algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
15.1.1
Regresión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
15.1.2
Valores atípicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .69
15.1.3
Serie temporal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Manual del usuario de SAP Predictive Analysis
Tabla de contenidos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
3
15.2
15.3
15.4
4
15.1.4
Árboles de decisiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
15.1.5
Red neural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
15.1.6
Agrupación en clúster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
15.1.7
Asociación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
15.1.8
Clasificación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Componentes de preparación de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
15.2.1
Fórmula. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
15.2.2
Muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
15.2.3
Definición del tipo de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
15.2.4
Filtro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .120
15.2.5
Normalización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
15.2.6
Categorización de HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .127
15.2.7
Normalización de HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Grabadores de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
15.3.1
CSV Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
15.3.2
JDBC Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
15.3.3
HANA Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
Modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Tabla de contenidos
1
Recursos de documentación de SAP
Predictive Analysis
En la tabla siguiente se proporciona la lista de manuales disponibles para SAP Predictive Analysis:
Tabla 1:
¿Qué es lo que se desea hacer?
Entonces vaya aquí...
Obtenga ayuda instantánea sobre cómo usar SAP Pre­
dictive Analysys o encuentre información sobre una
función o un flujo de trabajo.
La Ayuda en pantalla está disponible dentro de la apli­
cación del siguiente modo:
●
Haga clic en el icono de ayuda (?) en un cuadro o
ventana de diálogo.
●
Seleccione
Ayuda
Ayuda .
Obtenga documentación completa sobre cómo usar
SAP Predictive Analysis (en inglés).
Página de inicio de SAP Predictive Analysis
Obtenga documentación completa sobre cómo usar
SAP Predictive Analysis en un idioma distinto.
Página Todos los productos de SAP
Haga clic en un idioma, seleccione SAP Predictive
Analysis y la versión de las listas desplegables.
Obtenga la información más actualizada sobre el so­
Matriz de disponibilidad de productos SAP
porte de base de datos y del software para SAP Predic­
tive Analysis.
Manual del usuario de SAP Predictive Analysis
Recursos de documentación de SAP Predictive Analysis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
5
2
Novedades de SAP Predictive Analysis 1.15
Las siguientes nuevas funciones están disponibles en esta versión de SAP Predictive Analysis:
Novedades de esta versión
Descripción
Nuevo algoritmo PAL
El algoritmo HANA Naive Bayes ahora está disponible
en SAP Predictive Analysis para análisis.
Cambio de terminología
A partir de esta versión, los atributos se denominan Di­
mensiones.
6
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Novedades de SAP Predictive Analysis 1.15
3
Acerca de este manual
3.1
Ámbito de este manual
Este manual ofrece:
●
Información general de SAP Predictive Analysis
●
Información sobre cómo instalar y configurar SAP Predictive Analysis
●
Información acerca de los distintos algoritmos y componentes disponibles de SAP Predictive Analysis
●
Información sobre cómo crear análisis y modelos
●
Información sobre cómo analizar datos mediante técnicas de visualización predictiva
Este manual no incluye:
●
Cómo adquirir datos desde varios orígenes de datos
●
Cómo realizar operaciones de manipulación de datos, limpieza de datos y operaciones de mejoras
semánticas en la ficha Preparar
●
Cómo crear cuadros de historias
●
Cómo compartir gráficos y conjuntos de datos
Nota
SAP Predictive Analysis hereda la funcionalidad de adquisición de datos y de manipulación de datos de SAP
Lumira. Por lo tanto, para obtener información acerca de los flujos de trabajo que no se tratan en este manual,
consulte el Manual de usuario de SAP Lumira disponible en: http://help.sap.com/lumira. Se recomienda leer el
Manual de usuario de SAP Lumira junto con el Manual de usuarios de SAP Predictive Analysis para comprender
el flujo de trabajo completo para analizar datos mediante los algoritmos de análisis predictivo.
3.2
Audiencia de destino
Esta guía está destinada a analistas profesionales de datos, usuarios empresariales, estadísticos y científicos de
datos que desean usar la aplicación SAP Predictive Analysis para analizar y visualizar datos usando algoritmos
predictivos.
Nota
Para usar la aplicación SAP Predictive Analysis debe familiarizarse con los algoritmos estadísticos y de minería
de datos y tener un conocimiento básico acerca del uso de estos algoritmos.
Manual del usuario de SAP Predictive Analysis
Acerca de este manual
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
7
4 Información general de SAP Predictive
Analysis
SAP Predictive Analysis es una solución de análisis estadístico y minería de datos que permite elaborar modelos
predictivos para descubrir perspectivas y relaciones ocultas en los datos, desde los que puede realizar
predicciones sobre eventos futuros.
Con SAP Predictive Analysis, puede realizar varios análisis en los datos, incluida la previsión de series de tiempo,
la detección de valores atípicos, el análisis de tendencias, el análisis de clasificación, el análisis de segmentación y
el análisis de afinidad. Esta aplicación permite analizar datos mediante distintas técnicas de visualización, como
gráficos de matriz de dispersión, coordenadas paralelas, gráficos de clúster y árboles de decisiones.
SAP Predictive Analysis ofrece una gama de algoritmos de análisis predictivo, admite el uso del idioma de análisis
estadístico de origen abierto R y ofrece capacidades de minería de datos en la memoria para gestionar de forma
eficaz análisis de datos de gran volumen.
Nota
SAP Predictive Analysis hereda la funcionalidad de adquisición de datos y de manipulación de datos de SAP
Lumira. SAP Lumira es una herramienta de manipulación y visualización de datos. Con SAP Lumira, puede
conectarse a varios orígenes de datos, como archivos sin procesar, bases de datos relacionales, bases de
datos en memoria y universos de SAP BusinessObjects, y puede trabajar en distintos volúmenes de datos,
desde una pequeña matriz de datos de un archivo CSV hasta un conjunto de datos muy grande de SAP HANA,
puede seleccionar y limpiar los datos, y manipular los datos.
8
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Información general de SAP Predictive Analysis
5
Instalar SAP Predictive Analysis
5.1
Requisitos previos de instalación
Antes de instalar SAP Predictive Analysis, asegúrese de que se cumplen los siguientes requisitos:
●
En el equipo debe estar instalado el sistema operativo Microsoft Windows 7 o Microsoft Windows 8 R2. SAP
Predictive Analysis se puede usar tanto en equipos de 32 bits como de 64 bits.
●
Si ya ha instalado SAP Lumira en el equipo, deberá desinstalarlo antes de instalar SAP Predictive Analysis.
●
Debe tener derechos de administrador para desinstalar SAP Predictive Analysis del equipo.
●
Debe haber disponible suficiente espacio en disco en los siguientes recursos:
Recurso
Espacio necesario
Unidad donde se encuentra la carpeta Datos de programa
del usuario
2,5 GB
Carpeta temporal del usuario (\AppData\Local
322 MB
\Temp)
Unidad donde se encuentra el directorio de instalación
●
1 GB
Deben estar disponibles los siguientes puertos:
Puerto
Necesario para
Cualquier puerto del intervalo 4520-4539
Instalación de SAP Predictive Analysis
Para obtener una lista detalladas de los entornos admitidos y los requisitos de hardware, consulte la Product
Availability Matrix en: http://service.sap.com/pam
5.2 Usar el programa de instalación de SAP Predictive
Analysis
El programa de instalación de SAP Predictive Analysis se encuentra en el archivo autoextraíble
(SAPPredictiveAnalysisSetup.exe). El programa es un asistente de instalación que le guía en el proceso de
instalación de los recursos necesarios de SAP Predictive Analysis en su equipo. El programa reconoce
automáticamente el sistema operativo del equipo y comprueba los requisitos de la plataforma. Actualiza los
archivos según sea necesario.
5.2.1
Instalar SAP Predictive Analysis usando el programa de
instalación
1.
Desplácese al archivo autoextraíble de SAP Predictive Analysis ( SAPPredictiveAnalysisSetup.exe ) y haga
doble clic.
Manual del usuario de SAP Predictive Analysis
Instalar SAP Predictive Analysis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
9
Se muestra el cuadro de diálogo "Control de cuentas de usuario" con un mensaje de advertencia.
2.
Elija Sí en la petición de confirmación.
El programa de instalación de SAP Predictive Analysis se extraerá desde el archivo. El gestor de instalación
comprueba si se cumplen todos los requisitos para la instalación. Si la comprobación de algún requisito
resulta insatisfactoria, se abre una página Requisitos previos. Cierre el asistente y corrija los requisitos
previos que no se cumplan antes de volver a ejecutar SAPPredictiveAnalysisSetup.exe.
Si se confirman todos los requisitos previos para la instalación, se abre la página Definir propiedades.
3.
Seleccione el idioma de instalación de la lista desplegable.
4.
Especifique la carpeta de destino para instalar SAP Predictive Analysis.
○
Para aceptar el directorio de instalación predeterminado, elija Siguiente.
○
Para instalarSAP Predictive Analysis en una ubicación diferente, elija Examinar. Seleccione la carpeta que
desee y elija Siguiente.
Aparece la página Acuerdo de licencia.
5.
Revise el acuerdo de licencia y seleccione Acepto el contrato de licencia y elija Siguiente.
Aparecerá la página Registro.
6.
Elija uno de los tipos de registro siguientes y, a continuación, rellene la información solicitada:
Tabla 2:
Seleccione un tipo de registro
Indique esta información
Descripción
Usuario nuevo de SAP Lurima
Cloud
Indique la información necesaria
para crear una cuenta nueva SAP
Lumira Cloud.
Si se registra como un usuario
SAP Lumira Cloud, se publicarán
los documentos en la nube.
Usuario existente de SAP Lurima
Cloud
Indique su correo electrónico para
su cuenta de SAP Lumira Cloude­
xistente.
Código clave
Introduzca su código clave.
Registrar más tarde.
Se instala la versión de SAP Pre­
dictive Analysis que se corres­
ponde con su clave de licencia.
Puede elegir la versión con la que
prefiere trabajar más tarde con la
versión de prueba.
7.
Seleccione Siguiente.
Aparecerá la página Listo para instalación. Si es preciso, podrá volver atrás para modificar la información de
instalación.
8.
Para comenzar la instalación, elija Siguiente.
La instalación ha finalizado cuando se abre la página Finalizar instalación.
9.
Para iniciar automáticamente el programa, seleccione Iniciar SAP Predictive Analysis al finalizar la instalación.
10. Para salir de esta instalación, elija Finalizar.
10
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Instalar SAP Predictive Analysis
5.3
Realizar una instalación sin supervisión
Al usar una instalación sin supervisión, los administradores del sistema pueden ejecutar una secuencia de
comandos desde la línea de comandos para instalar automáticamente SAP Predictive Analysis en cualquier
equipo de su sistema sin que el programa de instalación les solicite información ni muestre la barra de progreso.
La instalación sin supervisión está principalmente orientada a los usuarios con funciones de administración de
red. Una instalación silenciosa es especialmente útil cuando es necesario realizar varias instalaciones en una red
empresarial. Después de crear el archivo de respuesta de la instalación sin supervisión, puede agregar el
comando de instalación sin supervisión a sus secuencias de comandos de instalación.
5.3.1
Realizar una instalación sin supervisión
Puede usar el extractor automático de SAP Predictive Analysis para crear un archivo de respuesta necesario para
realizar una instalación sin supervisión. Siga estas instrucciones para crear un archivo de respuesta y realizar una
instalación sin supervisión.
1.
Haga clic en
Inicio
Ejecutar y escriba cmd para abrir una ventana del símbolo del sistema.
2.
Desplácese al archivo autoextraíble de SAP Predictive Analysis:
SAPPredictiveAnalysisSetup.exe
3.
Ejecute el siguiente comando:
SAPPredictiveAnalysisSetup.exe -w <<response_filepath>>\response.ini
Nota
<<ruta_archivo_respuesta>> representa la ruta de archivo donde quiere guardar el archivo de
respuesta
.
Se abre el programa de instalación de SAP Predictive Analysis.
4.
Siga el asistente de instalación para seleccionar las opciones de instalación de SAP Predictive Analysis.
5.
En la página Iniciar la instalación, haga clic en Siguiente.
El programa de instalación escribe las opciones de instalación en el archivo response.ini y se cierra.
Consejo
Puede abrir response.ini en un editor de texto para revisar las opciones de la instalación.
6.
Para ejecutar la instalación sin supervisión, abra una ventana de Símbolo del sistema e introduzca el siguiente
comando:
SAPPredictiveAnalysisSetup.exe -s -r <<response_filepath>>\response.ini
El parámetro -r requiere el nombre y la ubicación del archivo de respuesta tal como se especifica en el paso
3. El parámetro opcional -s oculta la barra de progreso de la extracción automática durante la instalación sin
supervisión.
Manual del usuario de SAP Predictive Analysis
Instalar SAP Predictive Analysis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
11
5.4
Configurar registros de seguimiento
Este procedimiento se usa para permitir que la aplicación SAP Predictive Analysis registre información sobre la
ejecución de la aplicación. Esta información de registro ayuda a identificar los puntos conflictivos cuando la
aplicación falla o detecta un problema.
De forma predeterminada, los mensajes de error y los mensajes de seguimiento se escriben en la carpeta %TEMP%
\sapvi\logs del equipo. Sin embargo, puede cambiar la ubicación predeterminada de la carpeta en la que se
escribe la información de instalación al realizar los siguientes pasos:
1.
Cree una carpeta en una ubicación para generar registros.
Nota
Asegúrese de que dispone de permiso de "escritura" en la carpeta.
Por ejemplo, C:\logs.
2.
Cree el archivo BO_Trace.ini y agregue los siguientes detalles de seguimiento.
active=false;
severity='E';
importance=xs;
size=1000000;
keep_num=437;
alert=true;
En la siguiente tabla se enumeran los parámetros generales para configurar el seguimiento de servidor.
Parámetro
Valores posibles
Descripción
active
false, true
Si se configura en true, se realizará el
seguimiento de los mensajes de
seguimiento que cumplan con el
umbral configurado en el parámetro
importance. Si se configura en false,
no se realizará el seguimiento de los
mensajes de seguimiento basados en
su nivel de "importancia". El valor
predeterminado es false.
importance
'<<', '<=', '==', '>=', '>>', xs, s, m, l, xl
Especifica el umbral para los mensajes
de seguimiento. Se realizará el
Nota
importance = xs o importance = <<
son las opciones más detalladas
seguimiento de todos los mensajes
que estén más allá de este umbral. El
valor predeterminado es m (medio).
disponibles mientras que
importance = xl o importance = >>
son las menos detalladas.
12
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Instalar SAP Predictive Analysis
Parámetro
Valores posibles
Descripción
alert
false, true
Si se configura en true, se realizará el
seguimiento de los mensajes de
seguimiento que cumplan con el
umbral configurado en el parámetro
severity. Si se configura en false, no se
realizará el seguimiento de los
mensajes de seguimiento basados en
su nivel de "gravedad". El valor
predeterminado es true.
severity
' ', 'W', 'E', 'A', correcto, advertencia,
error, aserción
Especifica la gravedad de umbral a
partir de la que se puede realizar el
seguimiento de los mensajes. El valor
predeterminado es 'E'.
size
Los valores posibles son enteros >=
1000
Especifica el número de mensajes de
un archivo de registro de seguimiento
antes de que se cree otro nuevo. El
valor predeterminado es 100000.
keep_num
administrator
Los valores posibles son enteros >=
1000
Especifica el número de registros para
Cadenas o enteros
Especifica una notación que se
conservar.
utilizará en el archivo de registro. Por
ejemplo, si
administrator = "hello"
esta cadena se inserta en el archivo de
registro.
log_dir
Por ejemplo, C:\logs.
Especifica el directorio de archivos de
registro de salida. De forma
predeterminada, los archivos de
registro se almacenan en la carpeta
Logging.
always_close
on, off
Especifica si el archivo de registro se
debe cerrar después de que se escriba
un seguimiento en el archivo de
registro. El valor predeterminado es
off.
3.
Guarde y cierre el archivo BO_trace.ini.
4.
Coloque el archivo BO_Trace.ini en C:\logs.
5.
Configure las siguientes variables de entorno:
○
BO_TRACE_LOGDIR = C:/logs
○
BO_TRACE_CONFIGDIR = C:/logs
Manual del usuario de SAP Predictive Analysis
Instalar SAP Predictive Analysis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
13
○
6.
BO_TRACE_CONFIGFILE = C:/logs/BO_Trace.ini
Reinicie la aplicación.
Los registros de aplicación se generan en la ubicación especificada. Por ejemplo, C:\logs.
5.5
Para desinstalar SAP Predictive Analysis
1.
Elija
2.
Elija Desinstalar un programa.
3.
Haga clic con el botón derecho en SAP Predictive Analysis y elija Desinstalar.
Se muestra el asistente de instalación de SAP Predictive Analysis.
4.
En la página Confirmar desinstalación, elija Siguiente.
5.
Para completar la desinstalación, elija Finalizar.
5.6
Inicio
Panel de control
Programas .
Consideraciones importantes para usar SAP HANA
Esta sección contiene las consideraciones y requisitos importantes para usar SAP Predictive Analysis con la base
de datos de SAP HANA.
Requisitos de seguridad para publicar en SAP HANA
Antes de que los usuarios puedan publicar contenido en SAP HANA, se les deben asignar privilegios y funciones.
Estas funciones y privilegios también son necesarios para recuperar datos de SAP HANA. Use la aplicación SAP
HANA Studio para signar funciones y privilegios a los usuarios. Para obtener información acerca de la
administración de la base de datos de SAP HANA y el uso de SAP HANA Studio, consulte Base de datos de SAP
HANA: Manual de administración. Para obtener información acerca de la seguridad de usuario, consulte el Manual
de seguridad de SAP HANA (incluida Seguridad de base de datos de SAP HANA).
Se le debe asignar a la cuenta de usuario que se use para iniciar sesión en el sistema de SAP HANA desde SAP
Predictive Analysis la función MODELING (en SAP HANA).
Nota
Esta acción solo la puede realizar un usuario con los privilegios ROLE_ADMIN en la base de datos de SAP
HANA.
Cuando un usuario de SAP Predictive Analysis inicia sesión en el sistema de SAP HANA, la cuenta _SYS_REPO
interna debe:
●
Disponer de los privilegios SQL SELECT.
●
Tener la opción Se puede conceder a otros seleccionada en el esquema del usuario (SAP Predictive
Analysis).
14
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Instalar SAP Predictive Analysis
5.6.1 Para configurar _SYS_REPO para el usuario de SAP
Predictive Analysis
Si ya hay una cuenta de un usuario de SAP Predictive Analysis definida en el sistema SAP HANA:
1.
Desde la conexión del sistema en la ventana Navegador de SAP HANA Studio, seleccione Catálogo >
Autorización > Usuarios.
2.
Haga doble clic en la cuenta _SYS_REPO.
3.
En la ficha Privilegios de SQL, haga clic en el icono + , introduzca el nombre del esquema del usuario y pulse
Aceptar.
4.
Elija SELECT y el Sí correspondiente en Se puede conceder a otros.
5.
Elija Implementar o Guardar.
Nota
Los usuarios también pueden abrir un editor de SQL en SAP HANA Studio y ejecutar la siguiente
instrucción SQL:
GRANT SELECT ON SCHEMA <user_account_name> TO _SYS_REPO WITH GRANT OPTION
5.6.2
Indicadores OLAP admitidos
SAP HANA admite solo los siguientes indicadores de agregación en orígenes de datos OLAP
●
SUMA
●
MIN
●
MAX
●
CONTAR
Si su conjunto de datos contiene una agregación basada en un indicador que no se encuentra en la lista superior,
SAP HANA ignorará la agregación durante la publicación y esta no formará parte del resultado final publicado.
5.6.3 Obtener privilegios de esquema para acceder al origen
de datos de HANA en línea
Los privilegios de esquema (_SYS_REPO , _SYS_BI , _SYS_BIC ) los proporciona el administrador de SAP HANA. Si
una cuenta para un usuario de SAP Predictive Analysis ya está definida en el sistema de SAP HANA, el
administrador de SAP HANA debe realizar los siguientes pasos para conceder los privilegios de esquema al
usuario de SAP Predictive Analysis:
1.
Desde la conexión del sistema de la ventana Navegador SAP HANA Studio, seleccione Seguridad > Usuarios.
2.
Haga doble clic en la <cuenta de usuario de HANA en línea>.
3.
En la ficha Privilegios SQL, haga clic en el icono + , seleccione _SYS_REPO y Aceptar.
Manual del usuario de SAP Predictive Analysis
Instalar SAP Predictive Analysis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
15
4.
En Privilegios para '_SYS_REPO', seleccione SELECT.
Lleve a cabo los mismos pasos para el esquema _SYS_BI y el esquema _SYS_BIC.
5.6.4 Privilegios para ejecutar algoritmos PAL con la
biblioteca de funciones de aplicación (AFL)
Si ya se ha definido una cuenta en el sistema de SAP HANA para el usuario de SAP Predictive Analysis, el
administrador de SAP HANA debe realizar los siguientes pasos:
1.
Desde la conexión del sistema de la ventana Navegador SAP HANA Studio, seleccione Seguridad > Usuarios.
2.
Haga doble clic en la <cuenta de usuario de HANA en línea>.
3.
En la ficha Privilegios SQL, haga clic en el icono + , seleccione AFL_WRAPPER_GENERATOR(SYSTEM) y
Aceptar.
4.
En Privilegios para 'AFL_WRAPPER_GENERATOR(SYSTEM)', seleccione EXECUTE.
5.
En la ficha Funciones concedidas, haga clic en el icono + , seleccione AFL__SYS_AFL_AFLPAL_EXECUTE y
Aceptar.
Para obtener más información sobre cómo instalar la AFL y crear el procedimiento
AFL_WRAPPER_GENERATOR(SYSTEM), consulte el Manual de referencia de la Biblioteca de Predictive Analysis
(PAL) de SAP HANA
5.7 Consideraciones importantes para usar universos de SAP
BusinessObjects
Para adquirir datos de universos que existen en la plataforma de BI 4.0, asegúrese de que el servidor de Web
Intelligence está en funcionamiento. Para obtener una lista completa de plataformas de BI compatibles, consulte
SAP Products Availability Matrix
16
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Instalar SAP Predictive Analysis
6 Instalación y configuración de R en código
abierto
R es un idioma de programación de código abierto y un entorno de software para estadística informática.
6.1
Instalar R-3.0.1 y los paquetes necesarios
Para usar algoritmos R de código abierto en sus análisis, debe instalar el entorno R y configurarlo con la aplicación
SAP Predictive Analysis.
SAP Predictive Analysis ofrece una opción que permite instalar y configurar R 3.0.1 y los paquetes necesarios
desde la aplicación. Asegúrese de que está conectado a Internet cuando instale R.
Antes de instalar R-3.0.1 de la aplicación, asegúrese de que se cumplen los requisitos siguientes:
●
El R existente está desinstalado y las entradas de registro y la carpeta de instalación de R se han eliminado de
la máquina.
●
Las variables del entorno de R (R_LIBS, R_HOME) y las variables de la ruta de R se han eliminado.
Para instalar el entorno R y los paquetes necesarios, realice los siguientes pasos:
1.
Inicie la aplicación SAP Predictive Analysis.
2.
En el menú Archivo, elija Instalar y configurar R.
3.
Seleccione Instalar R.
4.
Lea el acuerdo de licencia de R de código abierto, las instrucciones importantes y seleccione Acepto instalar R
usando la secuencia de comandos.
5.
Seleccione Aceptar.
Nota
Si ya ha instalado R 3.0.1, puede usar este procedimiento para instalar los paquetes de R que desee.
Nota
R 2.11.1 no es compatible desde la versión SAP Predictive Analysis 1.14 en adelante.
6.2
Configurar R
Después de instalar R, debe configurar el entorno R para habilitar los algoritmos R en la aplicación. Si ya ha
instalado R-2.15.x o R-3.0.x y los paquetes necesarios, puede omitir el paso de instalación de R y configurar R
directamente.
Para configurar R, realice los siguientes pasos:
Manual del usuario de SAP Predictive Analysis
Instalación y configuración de R en código abierto
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
17
1.
Inicie la aplicación SAP Predictive Analysis.
2.
En el menú Archivo, elija Instalar y configurar R.
3.
En la ficha Configuración, seleccione Habilitar algoritmos R de Open Source.
4.
Seleccione Examinar para seleccionar la carpeta de instalación de R.
Por ejemplo, C:\Users\Public\R-3.0.1.
5.
Seleccione Aceptar.
Se muestra el cuadro de diálogo "Control de cuentas de usuario" con un mensaje de advertencia.
6.
Elija Sí en la petición de confirmación.
6.3 Consideraciones importantes para el uso de SAP
Predictive Analysis con algoritmos R en el modo online de SAP
HANA
SAP HANA admite la minería de datos In-DB mediante la integración R y la biblioteca de Predictive Analysis (PAL).
Al usar SAP Predictive Analysis con algoritmos de integración R en una base de datos de SAP HANA, tenga en
cuenta las siguientes consideraciones importantes:
●
Para usar algoritmos R en la base de datos de SAP HANA, debe instalar y configurar R en SAP HANA. Para
obtener información sobre cómo instalar y configurar R en SAP HANA, consulte el manual de integración R de
SAP HANA disponible en http://help.sap.com/hana/hana_dev_r_emb_en.pdf.
●
Asegúrese de que se ha concedido el privilegio de usuario Crear script R.
●
Asegúrese de que están instalados los siguientes paquetes antes de ejecutar los algoritmos R en SAP HANA.
○
RODBC
○
RJDBC
○
DBI
○
monmlp
○
AMORE
○
XML
○
PMML (pmml_1.2.32)
Nota
Si instala una versión anterior de PMML que pmml_1.2.32, no aparecerá la visualización de gráficos.
18
○
arules
○
caret
○
reshape
○
plyr
○
foreach
○
iterator
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Instalación y configuración de R en código abierto
7
Introducción a SAP Predictive Analysis
7.1
Conocimientos básicos de SAP Predictive Analysis
Componente
Un componente es la unidad de proceso básica de SAP Predictive Analysis. Cada componente contiene uno y/o
varios puntos de conexión de salida. Estos puntos de conexión sirven para conectar componentes mediante
conectores. Cuando se conectan componentes entre sí, los datos se transmiten de los componentes
predecesores a sus componentes sucesores.
SAP Predictive Analysis consta de los componentes siguientes:
●
Preprocesadores
●
Algoritmos
●
Grabadores de datos
Puede obtener acceso a los componentes desde la vista Diseñador del panel Predecir. Una vez que haya agregado
componentes al editor de análisis, el icono de estado de los componentes permite identificar sus estados.
Los estados de un componente pueden ser:
●
Sin icono de estado: este estado se muestra cuando se arrastra un componente al editor de análisis. Indica
que el componente tiene que configurarse antes de ejecutar el análisis.
●
(Configurado): este estado se muestra cuando se han configurado para el componente todas las
propiedades necesarias.
●
●
(Correcto): este estado se muestra tras la ejecución correcta del análisis.
(Error): este estado se muestra si la ejecución del análisis no finaliza correctamente debido al
componente.
Análisis
Un análisis es una serie de componentes diferentes conectados entre sí en un orden determinado con conectores,
que definen la dirección del flujo de datos.
Manual del usuario de SAP Predictive Analysis
Introducción a SAP Predictive Analysis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
19
Modelo
Un modelo es un componente reutilizable creado para enseñar a un algoritmo a usar datos históricos.
Modo de trabajo en base de datos (In-DB)
En base de datos (In-DB) es un modo de ejecución de análisis en el que el proceso de datos se realiza en la base
de datos de SAP HANA usando las capacidades de minería de datos. En este modo, los datos nunca se extraen de
la base de datos para su proceso y, por ello, la velocidad de proceso es muy elevada. Este modo se puede usar
para procesar conjuntos de datos grandes. SAP HANA admite la minería de datos In-DB mediante la integración R
y la biblioteca de Predictive Analysis (PAL).
Modo de trabajo en proceso (In-proc)
En proceso (In-Proc) es un modo de ejecución de análisis en el que el proceso de los datos se realiza extrayendo
los datos de la base de datos en un espacio de proceso de análisis predictivo. En este modo no puede utilizar los
algoritmos PAL de SAP HANA para el análisis. No obstante, puede trabajar con algoritmos R y SAP. Este tipo de
análisis también es conocido como análisis Out-DB.
7.2
Iniciar SAP Predictive Analysis
Para iniciar SAP Predictive Analysis, elija
Predictive Analysis
7.3
Inicio
Todos los programas
SAP Business Intelligence
SAP
SAP Predictive Analysis .
Comprender SAP Predictive Analysis
Al iniciar SAP Predictive Analysis, aparece la página de inicio. La página de inicio contiene información que le
ayuda a comenzar con SAP Predictive Analysis.
También dispone de la carpeta Ejemplos, que contiene dos documentos de ejemplo de SAP Predictive Analysis:
Análisis de satisfacción de cliente y Análisis de previsión de ingresos. También puede ver
los documentos de ejemplo de SAP Predictive Analysisen SAP Lumirautilizando la clave de licencia de prueba de
SAP Predictive Analysis.
Para comenzar con el análisis de datos utilizando SAP Predictive Analysis, necesita completar las siguientes
tareas:
●
20
Conéctese al origen de datos y adquiera los datos para el análisis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Introducción a SAP Predictive Analysis
●
Preparar los datos para el análisis mediante la aplicación de funciones de manipulación de datos y de limpieza
de datos
●
Analizar datos mediante la aplicación de algoritmos de minería de datos y de análisis estadísticos
●
Compartir conjuntos de datos y gráficos con colaboradores externos
Nota
En este manual se describe cómo analizar datos mediante la aplicación de algoritmos de minería de datos y de
análisis estadísticos. Para obtener información sobre cómo adquirir datos, preparar datos y compartir
conjuntos de datos, consulte el Manual de usuario de SAP Lumira que está disponible en http://help.sap.com/
lumira.
Una vez que se hayan adquirido datos del origen de datos, debe cambiar a la ficha Predecir para analizar los
datos.
7.3.1
Vista Diseñador
La vista Diseñador le permite diseñar y ejecutar análisis y crear modelos predictivos.
Manual del usuario de SAP Predictive Analysis
Introducción a SAP Predictive Analysis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
21
7.3.2
Vista Resultados
La vista Resultados le permite comprender los datos y los resultados de análisis mediante diferentes técnicas de
visualización y gráficos intuitivos.
7.4
Usar SAP Predictive Analysis del principio al final
A continuación, se facilita información general del proceso que puede seguir para crear un gráfico basado en un
conjunto de datos. El proceso no es lineal y puede ir de un paso a uno anterior para ajustar el gráfico o los datos.
Pasos para trabajar con los da­ Descripción
tos
Conéctese al origen de datos.
Nota
Para obtener información so­
bre cómo conectarse al ori­
gen de datos, consulte la sec­
ción Conectarse al origen de
datos del Manual de usuario
de SAP Lumira.
22
Si el origen de datos es:
●
RDBMS: introduzca las credenciales, conéctese al servidor de base de da­
tos, examine y seleccione el origen de datos; por ejemplo, si se está co­
nectando a SAP HANA, seleccione una vista y un cubo para crear el grá­
fico.
●
Archivo plano: elija las columnas que desea adquirir, reducir o mostrar y
ocultar.
●
Universo: introduzca las credenciales de universo, conéctese al reposito­
rio del Servidor de administración central y seleccione un universo para
crear el gráfico.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Introducción a SAP Predictive Analysis
Pasos para trabajar con los da­ Descripción
tos
Vea y organice las columnas y
las dimensiones.
Nota
Para obtener información so­
bre cómo ver columnas y di­
mensiones, consulte la sec­
ción Preparar los datos del
Manual de usuario de SAP Lu­
mira.
Analice los datos usando algo­
ritmos de análisis predictivo.
Nota
En este manual, se propor­
ciona información sobre
cómo analizar los datos
usando los algoritmos de
análisis predictivo.
Puede ver los datos adquiridos como columnas o restricciones. Puede organi­
zar los datos mostrados para facilitar la creación de gráficos realizando estas
acciones del modo siguiente:
●
Crear filtros y ocultar las columnas no necesarias
●
Crear indicadores, jerarquías temporales y geográficas
●
Limpiar y organizar los datos en columnas usando un rango de herra­
mientas de manipulación
●
Crear columnas con fórmulas usando una amplia selección de funciones
disponibles
Cuando disponga de los datos pertinentes en la ficha Preparar, cambie a la fi­
cha Predecir y cree un análisis para descubrir patrones en los datos y predecir
los resultados futuros.
En la ficha Predecir, puede hacer lo siguiente:
●
Crear un análisis
●
Crear modelos predictivos
●
Ver resultados de análisis
●
Ver visualizaciones de modelos
●
Crear gráficos
Nota
Para obtener información acerca de la creación de gráficos, consulte la
sección Visualizar los datos del Manual de usuario de SAP Lumira.
Guardar el análisis
Manual del usuario de SAP Predictive Analysis
Introducción a SAP Predictive Analysis
Dar nombre y guardar el análisis que incluye los gráficos. Los análisis se guar­
dan en un documento con el formato de archivo .lums en la carpeta de la apli­
cación en Documentos en la ruta del perfil.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
23
8
Crear análisis
8.1
Crear un análisis
Puede usar SAP Predictive Analysis para realizar minería y análisis estadísticos de datos mediante la ejecución de
los datos con una serie de componentes. Los componentes de la serie están conectados entre sí con conectores,
lo que define la dirección del flujo de datos. Este proceso recibe el nombre de análisis.
Un documento es el punto de inicio al usar SAP Predictive Analysis. Debe crear un documento para empezar a
analizar los datos y crear nuevos análisis. Puede abrir documentos guardados que están almacenados localmente
para ver o modificar análisis y conjuntos de datos existentes.
Cada documento es un archivo que contiene:
●
Parámetros de conexión para el origen de datos, si el origen es un RDBMS.
●
Conjunto de datos: los datos de la columna usada para crear gráficos.
●
Análisis y modelos y sus resultados.
●
Los gráficos se crean a partir de los datos y se guardan como visualizaciones.
Para crear un análisis, realice los siguientes pasos:
1.
Adquiera datos de un origen de datos
2.
(Opcional) Prepare los datos para el análisis (por ejemplo, filtrando los datos)
3.
Aplique algoritmos
4.
(Opcional) Almacene los resultados de los análisis para realizar análisis posteriores
Para agregar múltiples análisis al documento, seleccione el botón Añadir análisisde la barra de herramientas de
análisis.
Enlaces relacionados
Adquirir datos de un origen de datos [página 24]
Preparar los datos para el análisis [página 25]
Aplicar algoritmos [página 26]
Almacenar resultados del análisis [página 28]
8.1.1
Adquirir datos de un origen de datos
1.
En la página de inicio, seleccione
Archivo
2.
Conéctese o desplácese al origen de datos.
Nuevo .
Puede adquirir datos de los orígenes de datos siguientes:
24
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Crear análisis
3.
Origen de datos
Descripción
Microsoft Excel
Puede adquirir datos de una hoja de cálculo Micro­
soft Excel y realizar un análisis en proceso (in-proc)
usando algoritmos SAP y R.
CSV
Puede adquirir datos de un archivo de datos de valo­
res separados por comas y realizar un análisis en
proceso (in-proc) usando algoritmos SAP y R.
Conectarse a SAP HANA
Puede adquirir datos de las tablas, vistas y vista de
análisis de SAP HANA y realizar un análisis en base
de datos (in-db) con algoritmos PAL de SAP HANA.
En este modo, los datos nunca se extraen de la base
de datos para su proceso y, por ello, la velocidad de
proceso es muy elevada. Este modo se puede usar
para procesar conjuntos de datos grandes.
Descargar desde SAP HANA
Puede adquirir datos de las tablas, vistas y vista de
análisis de SAP HANA y realizar un análisis en pro­
ceso (in-proc) usando algoritmos SAP y R. En ese
modo, los algoritmos PAL de SAP HANA no están
disponibles para el análisis.
Descargar de un universo
Puede adquirir datos de universos de SAP Busines­
sObjects presentes en las plataformas XI 3.x y BI 4.x
y realizar un análisis en proceso (in-proc) usando al­
goritmos SAP y R.
Consulta con SQL
Puede crear un proveedor de datos propio introdu­
ciendo manualmente el SQL para un origen de datos
de destino y realizar un análisis en proceso (in-proc)
usando algoritmos SAP y R.
Elija Crear.
Ahora puede empezar a crear el análisis. En la ficha Predecir, se agrega el componente del origen de datos
configurado al editor de análisis. Puede ejecutar el análisis para ver los resultados del componente del origen de
datos.
Nota
Para obtener información sobre cómo conectarse a un origen de datos específico, consulte el Manual de
usuario de SAP Lumira disponible en http://help.sap.com/lumira.
8.1.2
Preparar los datos para el análisis
Este paso es opcional.
Es posible que, en muchos casos, los datos sin procesar del origen de datos no sean adecuados para el análisis.
Para obtener resultados precisos, es posible que tenga que preparar y procesar los datos antes del análisis.
Puede encontrar las funciones de manipulación de datos en la pestaña Preparar y las funciones de preparación de
Manual del usuario de SAP Predictive Analysis
Crear análisis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
25
datos en la pestaña Predecir. En la pestaña Preparar, puede trabajar con los datos estáticos o sin procesar que se
importen en SAP Predictive Analysis. En la ficha Predecir, puede trabajar con datos transitorios mediante
componentes de preprocesadores.
La preparación de datos implica la comprobación de los datos para la precisión y los campos faltantes, el filtrado
de datos según valores de rango, el muestreo de datos para investigar un subconjunto de datos y la manipulación
de datos. Puede procesar los datos mediante componentes de preparación de datos.
1.
En la ficha Predecir, haga doble clic en el componente de preprocesador necesario de la lista Componentes.
El componente de preprocesador se agrega al editor de análisis y se crea una conexión automática al
componente de fuente de datos.
2.
Desde el menú contextual del componente de preprocesador, seleccione Configurar propiedades.
3.
En el cuadro de diálogo de propiedades de componente, introduzca los detalles necesarios para las
propiedades del componente de preprocesador.
4.
Seleccione Fin.
5.
Para ver los resultados del análisis, seleccione
Ejecutar.
Enlaces relacionados
Componentes de preparación de datos [página 111]
Adding Custom Component [página 30]
8.1.3
Aplicar algoritmos
Cuando disponga de los datos pertinentes para el análisis, tendrá que aplicar los algoritmos adecuados para
descubrir los patrones de los datos.
Saber qué algoritmo se tiene que usar en cada caso no es evidente. Puede usar una combinación de algoritmos
para analizar los datos. Por ejemplo, primero puede usar algoritmos de series temporales para suavizar los datos
y después usar algoritmos de regresión para averiguar las tendencias.
En la tabla siguiente, se proporciona información sobre qué algoritmos elegir en determinados casos:
Realizar predicciones basadas en tiempo
Predicción de variables continuas basadas en otras variables
del conjunto de datos
26
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Algoritmos de series temporales
●
Suavizado exponencial sencillo
●
Suavizado exponencial doble
●
Suavizado exponencial triple
Algoritmos de regresión
●
Regresión lineal
●
Regresión exponencial
●
Regresión geométrica
●
Regresión algorítmica
Manual del usuario de SAP Predictive Analysis
Crear análisis
Localizar patrones frecuentes de conjuntos de elementos en
grandes conjuntos de datos transaccionales para generar
reglas de asociaciones
Agrupar observaciones en grupos de conjuntos de datos
similares
Clasificar y predecir una o más variables discretas sobre la
base de otras variables del conjunto de datos
Detectar valores atípicos del conjunto de datos
Predicción, clasificación y reconocimiento de patrón
estadístico
●
Regresión lineal múltiple
●
Regresión polinómica
●
Regresión logística
Algoritmos de asociación
●
Apriori
●
AprioriLite
Algoritmos de agrupación en clúster
●
K-Means
Árboles de decisiones
●
HANA C 4.5
●
Árbol CNR R
●
CHAID
Algoritmos de detección de valores atípicos
●
Rango intercuartil
●
Valor atípico de vecino más próximo
●
Detección de anomalías
●
Prueba de varianza
Algoritmos de red neuronal
●
Red neuronal NNet R
●
Red neuronal MONMLP R
Si no encontró un algoritmo relevante, puede crear su propio componente personalizado con el script de R en
SAP Predictive Analysis y realizar en el análisis en los datos que haya adquirido. Para obtener más información
sobre cómo añadir un componente adicional, consulte: Adding Custom Component [página 30]
1.
En la ficha Predecir, haga doble clic en el componente de algoritmo necesario de la lista Componentes.
El componente de algoritmo se agrega al editor de análisis y se conecta al componente anterior del análisis.
2.
Desde el menú contextual del componente de logaritmos, seleccione Configurar propiedades.
3.
En el cuadro de diálogo de propiedades de componente, introduzca los detalles necesarios para las
propiedades del componente de algoritmo.
4.
Seleccione Fin.
5.
Para ver los resultados del análisis, seleccione
Ejecutar.
Enlaces relacionados
Algoritmos [página 52]
Manual del usuario de SAP Predictive Analysis
Crear análisis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
27
8.1.4
Almacenar resultados del análisis
Este paso es opcional.
Puede almacenar los resultados del análisis en archivos planos o en bases de datos para analizarlos
posteriormente usando componentes grabadores de datos. Solo se almacena la vista de tabla en el componente
grabador de datos.
1.
En la ficha Predecir, haga doble clic en el componente grabador de datos necesario de la lista Componentes.
El componente grabador de datos se agrega al editor de análisis y se conecta al componente anterior del
análisis.
2.
Desde el menú contextual del componente grabador de datos, seleccione Configurar propiedades.
3.
En el cuadro de diálogo de propiedades del componente, introduzca los detalles necesarios para las
propiedades del componente grabador de datos.
4.
Seleccione Fin.
5.
Para ver los resultados del análisis, seleccione
Ejecutar.
Enlaces relacionados
Grabadores de datos [página 132]
8.2
Ejecutar el análisis
Para ejecutar el análisis, seleccione
Ejecutar en la barra de herramientas del editor de análisis.
Si su análisis es muy grande y complejo, puede ejecutar el análisis componente por componente y analizar los
datos. Para ejecutar una parte del análisis, seleccione Ejecutar hasta aquídesde el menú contextual del
componente hasta el que quiere realizar la ejecución.
8.3
Guardar el análisis
Después de crear un análisis, puede guardarlo para volverlo a usar en el futuro. En SAP Predictive Analysis, debe
guardar el documento para guardar el análisis que cree. El documento guardado contiene el conjunto de datos,
los análisis, resultados y visualizaciones. El documento se guarda con el formato de archivo .lums
Para guardar un análisis en un documento, realice los siguientes pasos:
1.
Seleccione
2.
Introduzca un nombre para el documento.
3.
Seleccione Guardar.
28
Archivo
Guardar .
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Crear análisis
Si crea varios análisis con el mismo conjunto de datos, todos los análisis se guardan en el mismo documento.
Puede acceder a todos los análisis de un documento mediante la lista desplegable Análisis.
8.4
Eliminación de análisis desde el documento
Para eliminar un análisis existente del documento, pase el puntero del ratón sobre la imagen del análisis de la
barra de análisis y seleccione
8.5
Ver resultados
Para ver los resultados de componentes en un análisis, una vez ejecutado, cambie a la vista Resultados o, en el
menú contextual del componente, seleccione Ver resultados.
Manual del usuario de SAP Predictive Analysis
Crear análisis
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
29
9
Adding Custom Component
As a statistician or a data scientist, you can create and add your component using R scripts in SAP Predictive
Analysis. The newly added component is classified under Custom R Componentsin the Components list,
depending on the type of component created. For example, it can be classified as an algorithm, a preprocessor
component or a data writer. You can use custom components in SAP Predictive Analysispara ejecutar el análisis
del conjunto de datos adquirido.
9.1
Asistente de creación de componentes R
Sintaxis
R es un idioma de programación de software y un entorno para el cálculo estadístico y los gráficos. SAP
Predictive Analysis le proporciona un entorno para utilizar scripts R (dentro de un formato de función R válido)
y crear un componente, que puede utilizarse para su análisis del mismo modo que para otro componente
existente. Durante la creación de un componente R, puede proporcionar un nombre para el componente que
aparece en la clasificación Componentes R personalizados de la lista Componente.
Propiedades del asistente de creación de componentes R
Nombre de componente
Introduzca un nombre para el componente.
Nota
No puede cambiar el nombre del componente personalizado existente.
Tipo de componente
Seleccione el tipo de componente.
Descripción de los componentes
Indique una descripción del componente. Ésta aparecerá como información en pantalla
del componente creado.
Cargar script R
Haga clic para cargar la secuencia de comandos.
Editor de secuencia de comandos
Copie y pegue o escriba el script R en la caja de texto.
Nombre de la función principal
Seleccione el nombre de la función que desee ejecutar.
Marco de datos de entrada
Seleccione el Marco de datos de entrada de la lista de parámetros.
30
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Adding Custom Component
Marco de datos de salida
Indique un nombre para la variable que desee utilizar como Marco de datos de salida.
Nombre de la variable de modelo
Indique un nombre para la variable que desee utilizar como variable de modelo.
Mostrar visualización
Mostrar resumen
Seleccione esta opción para visualizar el resumen del algoritmo tras la ejecución del
componente personalizado.
Opción para guardar el modelo
Seleccione esta opción para incluir la opción Guardar como modelo para el componente
personalizado.
Nota
Si selecciona Opción para guardar el modelo, se habilita la caja Nombre de variable de
modelo y aparece detalles de la función de puntaje modelo
Opción para exportar como PMML
Seleccione esta casilla de verificación para incluir la opción Exportar como PMML para el
componente personalizado.
Nota
Solo se habilita la Opción de exportar como PMMLsi selecciona la Opción para guardar
el modelo.
Nombre de la función Definición de puntaje de modelo
Seleccione el nombre de la función de puntaje modelo que desee ejecutar.
Marco de datos de entrada
Seleccione el Marco de datos de entrada de la lista de parámetros.
Marco de datos de salida
Indique un nombre para la variable que desee utilizar como Marco de datos de salida.
Nombre de la variable de modelo de entrada
Seleccione el Nombre de variable modelo de entrada de la lista de parámetros.
Tener en cuenta todas las columnas del componente anterior
Seleccione incluir la columna prevista del componente principal en la salida del
componente personalizado.
No tener en cuenta ninguno
Seleccione excluir la columna prevista del componente principal en la salida del
componente personalizado.
Tipo de datos
Seleccione el tipo de datospara la columna prevista del componente personalizado.
Nuevo nombre de columna prevista
Introduzca un nombre para la columna prevista. Ésta es la columna de salida del
componente personalizado.
Manual del usuario de SAP Predictive Analysis
Adding Custom Component
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
31
Parámetros de función
Nombre completo de la propiedad
Indique el nombre de la Columna independientey de la Columna dependiente que
aparecerá en la vista de propiedades del componente personalizado.
Tipo de control
Seleccione el Tipo de controlde la Columna independientey de la Columna dependiente.
Tener en cuenta todas las columnas del componente anterior
Seleccione incluir la columna prevista del componente principal en la salida del puntaje de
modelo.
No tener en cuenta ninguno
Seleccione excluir la columna prevista del componente principal en la salida del puntaje de
modelo.
Tipo de datos
Seleccione el Tipo de datospara la columna prevista del puntaje modelo.
Nuevo nombre de columna prevista
Introduzca un nombre para la columna prevista. Ésta es la columna de salida del puntaje
modelo.
Nombre de visualización de la propiedad
Introduzca el nombre de la columna que aparece en la vista de propiedades del modelo
guardado.
Enlaces relacionados
Crear un componente R [página 32]
9.2
Crear un componente R
Antes de crear un componente R, debe asegurarse de que cumple los siguientes requisitos:
●
La secuencia de comandos R está escrita en un formato de función R válido.
●
La secuencia de comandos R se ejecuta en la consola de GUI de R.
●
La secuencia de comandos R al menos tiene una función principal.
●
Los paquetes necesarios para ejecutar la secuencia de comandos R deben estar instalados en su máquina o
en el servidor de SAP HANA.
●
La secuencia de comandos R escrito para el análisis en la base de datos devuelve un marco de datos.
Debe tener en cuenta los siguientes procedimientos recomendados al escribir la secuencia de comandos R:
●
La secuencia de comandos R escrito para el análisis en proceso devuelve un marco de datos.
●
Se recomienda la conversión de tipo, por ejemplo, si una columna tiene valores numéricos, indíquela como
as.numeric(output)
32
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Adding Custom Component
●
Para variables de categoría utilizadas en la secuencia de comandos R, especifique la variable con el comando
as.factor.
A continuación se ofrece un ejemplo sobre cómo añadir un componente R personalizado en la lista Componentes
para realizar un análisis de base de datos en un conjunto de datos numérico:
1.
En la pestaña Predecir, en la lista Componentes seleccione
Aparece un asistente Crear nuevo componente R personalizado.
2.
En la ficha General, realice los siguientes subpasos:
Componente R .
a) En el cuadro de texto Nombre de componente, escriba Mi componente.
b) En la lista desplegable Tipo de componente, seleccione Algoritmo.
c) En el cuadro de texto Descripción de componente, escriba Componente R para regresión lineal
sencilla.
3.
Seleccione Siguiente.
Aparecerá la página Comando.
4.
En la página Comando, seleccione Cargar comando para seleccionar un archivo.
Nota
Escriba o copie y peque el siguiente comando R en el cuadro de texto.
Nota
Consulte los comentarios en la siguiente función R para poder entender y escribir su propio comando R.
#This is a sample script for a simple linear regression component.
#The script should be written in a valid R function format.
#Function name and variable name in R script can be user-defined, which are
supported in R.
#The following is the argument description for the primary function SLR:
#InputDataFrame - Dataframe in R that contains the output of the parent
component.
#The following two parameters are fetched from the user from the property view:
#IndepenentColumns - Column names that you want to use as independent
variables for the component.
#DependentColumn - Column name that you want to use as a dependent variable
for the component.
SLR<-function(InputDataFrame,IndepenentColumn,DependentColumn)
{
finalString<-paste(paste(DependentColumn,"~" ), IndepenentColumn); #
Formatting the final string to
#pass to "lm" function
slr_model<-lm(finalString); # calling the "lm" function and storing the output
model in "slr_model"
#To get the predicted values for the training data set, call the "predict"
function withthis model and
#input dataframe, which is represented by "InputDataFrame".
result<-predict(slr_model, InputDataFrame); # Storing the predicted values in
the "result" variable.
output<- cbind(InputDataFrame, result);#combining "InputDataFrame" and
"result" to get the final table.
plot(slr_model); #Plotting model visualization.
# returnvalue - function must always return a list that contains
results("out"), and model variable
#("slrmodel"), if present.
#The output variable stores the final result.
#The model variable is used for model scoring.
return (list(slrmodel=slr_model,out=output))
}
Manual del usuario de SAP Predictive Analysis
Adding Custom Component
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
33
#The following is the argument description for the model scoring function
"SLRModelScoring":
#MInputDataFrame - Dataframe in R that contains the output of the parent
component.
#MIndepenentColumns - Column names to be used as independent variables for the
component.
#Model - Model variable that is used for scoring.
SLRModelScoring<-function (MInputDataFrame, MIndependentColumn, Model)
{
#Calling "predict" function to get the predictive value with "Model " and
"MInputDataFrame".
predicted<-predict (Model, data.frame(MInputDataFrame [, MIndependentColumn]),
level=0.95);
# returnvalue - function should always return a list that contains the result
("model result"),
# The output variable stores the final result
return(list(modelresult=predicted))
}
A continuación se ofrecen dos ejemplos para convertir un comando R y un formato de función R válido
reconocidos por SAP Predictive Analysis:
Secuencia de comandos R
dataFrame<-read.csv("C:\\CSVs\
\Iris.csv")
attach(dataFrame)
set.seed(4321)
kmeans_model<kmeans(data.frame(`SepalLength`,`Sepa
lWidth`,
`PetalLength`,`PetalWidth`),
centers=5,iter.max=100,nstart=1,algor
ithm=
"Hartigan-Wong")
kmeans_model$cluster
dataFrame<read.csv("C:\\Datasets\\cnr\
\Iris.csv")
attach(dataFrame) library(rpart)
cnr_model<-rpart
(Species~PetalLength+PetalWidth
+SepalLength+
SepalWidth, method="class")
library(rpart)
predict(cnr_model, dataFrame,type =
c("class"))
34
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Formato de función R (que SAP Predictive
Analysis reconoce)
kmeansfunction<function(dataFrame,independent,
Clustersize,Iterations,algotype,numbe
rofinitialdsets)
{
set.seed(4321)
kmeans_model<kmeans(data.frame(dataFrame[,independ
ent]),
centers=Clustersize,iter.max=Iteratio
ns, nstart=numberofinitialdsets,
algorithm= algotype)
output<- cbind(dataFrame,
kmeans_model$cluster);
boxplot(output); return
(list(out=output));
}
cnrFunction<function(dataFrame,IndependentColumns
,dep)
{
library(rpart);
formattedString<paste(IndependentColumns, collapse =
'+');
finalString<-paste(paste(dep, "~" ),
formattedString); cnr_model<rpart(finalString, method="class");
output<- predict(cnr_model,
dataFrame,type=c("class"));
out<- cbind(dataFrame, output);
return
(list(result=out,modelcnr=cnr_model))
;
}
Manual del usuario de SAP Predictive Analysis
Adding Custom Component
Secuencia de comandos R
Formato de función R (que SAP Predictive
Analysis reconoce)
cnrFunctionmodel<function(dataFrame,ind,modelcnr,type)
{
output<predict(modelcnr,data.frame(dataFram
e[,ind]),type=type);
out<- cbind(dataFrame, output);
return (list(result=out));
5.
En la sección Nombre de la función principal, lleve a cabo los siguientes subpasos:
a) En la lista desplegable Nombre de la función principal, seleccione SLR.
b) En la lista desplegable Marco de datos de entrada, seleccione InputDataFrame.
c) En el cuadro Marcos de entrada de salida, escriba out.
d) Seleccione Opción para guardar como modelo.
El cuadro Nombre de variable de modelo está habilitado y aparece Detalles de la función Definición de
puntaje de modelo.
e) En el cuadro Nombre de variable de modelo, escriba slrmodel.
6.
En la sección Nombre de la función principal, lleve a cabo los siguientes subpasos:
a) En la sección Detalles de la función principal, seleccione Mostrar resumeny la opción para exportar como
PMML.
b) En la sección Detalles de función de puntaje modelo , desde el Nombre de función de puntaje modelo,
seleccione PuntajeModeloSLRM.
c) En la lista desplegable Marco de datos de entrada, seleccione MInputDataFrame.
d) En el cuadro Marcos de entrada de salida, escriba modelresult.
e) En la lista desplegable Nombre de la función principal modelo, seleccione Modelo.
7.
Seleccione Siguiente.
Aparece la página Opciones.
8.
En la sección Opciones de la función principal, lleve a cabo los siguientes subpasos:
a) En Definición de tabla de salida, seleccione Considerar ninguna.
b) En la lista desplegable Tipo de datos, seleccione Entero.
c) En el cuadro Nombre de nueva columna prevista, escriba Predicted column.
9.
En la sección Definición de la vista de propiedades, lleve a cabo los siguientes subpasos:
a) En Nombre de visualización de propiedad, del cuadro Columna independiente, escriba Independent
Column.
b) En la lista desplegable Tipo de control, seleccione Selector de columnas (individual)como tipo de control
para la Columna independiente.
c) En Nombre de visualización de propiedad, del cuadro Columna independiente, escriba Dependent
Column.
d) En la lista desplegable Tipo de control, seleccione Selector de columnas (individual)como tipo de control
paraColumna dependiente.
10. En la sección Opciones de puntaje modelo , en Definición de tabla de salida, seleccione Considerar todas las
columnas del componente anterior.
11. En la lista desplegable Tipo de datos, seleccione Entero.
12. En Nombre de nueva columna prevista, escriba Columna de salida.
Manual del usuario de SAP Predictive Analysis
Adding Custom Component
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
35
13. En la sección Definición de la vista de propiedades, lleve a cabo los siguientes subpasos:
a) En Nombre de visualización de propiedad, escriba Independent column.
b) En la lista desplegable Tipo de control, seleccione Selector de columnas (individual)como tipo de control
para la Columna independiente.
14. Seleccione Finalizar.
En función del tipo de análisis realizado, puede crear un modelo como para cualquier otro componente.
Enlaces relacionados
Asistente de creación de componentes R [página 30]
Modelos [página 134]
Crear un modelo [página 48]
36
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Adding Custom Component
10 Analizar datos
Tras la ejecución del análisis, el resultado de cada componente del análisis se representa mediante distintos
gráficos de visualización.
Para analizar los datos, realice los siguientes pasos:
1.
Después de ejecutar un análisis, cambie a la vista Resultados mediante el botón Resultados de la barra de
herramientas.
2.
Para mostrar la visualización de un componente, seleccione el componente necesario del análisis en la lista
Componente.
De forma predeterminada, el resultado del componente se muestra en la vista Tabla.
En la siguiente tabla se resumen los componentes y sus gráficos de visualización admitidos.
Componentes
Gráficos de visualización
Orígenes de datos y preprocesadores
Gráfico de matriz de dispersión, Gráfico de resumen
estadístico, Coordenadas paralelas
Algoritmos de agrupación en clúster
Gráficos de representación de clúster y resumen de
algoritmos
Árboles de decisiones
Árbol de decisiones, resumen de algoritmos y matriz de
confusión
Algoritmos de series temporales
Gráfico de tendencias, resumen de algoritmos
Algoritmos de regresión
Gráfico de tendencias, resumen de algoritmos
Algoritmos de asociación
Gráfico de nube de etiquetas a priori, resumen de algoritmos
En la siguiente tabla se resumen los puntos de datos compatibles para su visualización:
Nota
Si el conjunto de datos de entrada supera el límite de puntos de datos de interactividad, los gráficos se
representan sin interactividad. Si el conjunto de datos de entrada supera el límite de puntos de datos de
interactividad, los datos que superen ese límite no se muestran en el gráfico.
Tabla 3:
Gráficos
Número máximo de conexiones de datos compatible
Con interactividad
Sin interactividad
Gráfico de tendencias
4000
6000
Gráfico de matriz de dispersión
500
1000
Gráfico de coordenadas paralelas
60000
75000
Manual del usuario de SAP Predictive Analysis
Analizar datos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
37
10.1 Gráficos de visualización
10.1.1
Gráfico de matriz de dispersión
Los gráficos de matriz de dispersión son matrices de gráficos (gráficos n*n, donde n es el número de atributos
seleccionados) que se usan para comparar datos en diferentes dimensiones. De forma predeterminada se
seleccionan tres atributos numéricos como máximo para el análisis, comenzando en el primer atributo del origen
de datos, y se representa una matriz de gráficos 3*3. No obstante, puede seleccionar manualmente los atributos
necesarios desde Indicadores en la sección Datos y actualizar la visualización seleccionando Aplicar.
Nota
Puede seleccionar un máximo de tres atributos numéricos desde Indicadoresen la sección Datos.
10.1.2 Gráfico de resumen estadístico
El resumen estadístico ofrece información de resumen de los atributos numéricos del origen de datos. La
información de resumen incluye recuento, valor mínimo, valor máximo, varianza, desviación estándar, suma,
media, rango y número de registros. Se representa un gráfico de histograma para cada atributo.
38
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Analizar datos
10.1.3 Coordenadas paralelas
Coordinadas paralelas es una técnica de visualización que se usa para visualizar datos multidimensionales y
patrones multivariante en los datos del análisis.
En este gráfico, de forma predeterminada, los primeros siete atributos se representan con ejes paralelos
verticales. Puede seleccionar manualmente los atributos necesarios en la opción Indicadores y actualizar el
gráfico eligiendo Aplicar. Cada eje se identifica con el nombre de atributo y los valores mínimo y máximo de los
atributos. Las observaciones se representan como series de puntos conectados a lo largo de los ejes paralelos.
Puede seleccionar el color por opción para filtrar los datos en función del valor de categoría.
Nota
Puede seleccionar un máximo de siete atributos numéricos en la sección Indicadores.
Manual del usuario de SAP Predictive Analysis
Analizar datos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
39
10.1.4 Árbol de decisiones
Un árbol de decisiones es una técnica de visualización que permite clasificar observaciones en grupos y predecir
eventos futuros basados en un conjunto de reglas de decisiones.
Esta presentación se usa para el análisis de árboles de decisiones. Con esta técnica, se elabora un árbol de
decisiones binario al dividir las observaciones en subgrupos más pequeños hasta que se cumple el criterio de
detención. El nodo de hojas indica los datos clasificados. Se puede agrandar el árbol de decisiones al seleccionar
el botón de acercar.
Nota
La aplicación no puede procesar un árbol de decisiones si existen más de 32 valores categóricos para una
columna dependiente.
Nota
El aspecto del árbol de decisiones difiere según el proveedor de algoritmos. Por ejemplo, el árbol de decisiones
para el algoritmo Árbol R-CNR es distinto al árbol de decisiones para el algoritmo HANA C4.5.
Cada nodo del árbol de decisiones representa la clasificación de datos en dicho nivel. Puede ver el contenido del
nodo al seleccionar
40
en cada nodo.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Analizar datos
10.1.5 Gráfico de tendencias
Los gráficos de tendencias se usan para visualizar la correlación entre las variables dependientes e
independientes. En el modo de tendencia puede analizar el rendimiento del algoritmo mediante la comparación de
las variables dependientes reales con los valores previstos, donde las variables dependientes se representan
como un gráfico de barras y los valores previstos como un gráfico de líneas. En el modo de relleno, el algoritmo
rellena los valores que faltan y muestra el resultado como un gráfico de líneas.
Si el conjunto de datos es muy grande, el gráfico puede ser poco claro. Para mejorar la visibilidad de los datos, use
el selector Rango que se encuentra en la parte inferior del gráfico para seleccionar un rango de datos específico
del gran conjunto de datos. Los datos del área seleccionada se muestran en el editor de visualización.
Manual del usuario de SAP Predictive Analysis
Analizar datos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
41
Nota
En los gráficos de algoritmo Regresión lineal múltiple (MLR), el atributo de eje x se menciona como ID de
registro.
10.1.6 Gráfico de clúster
Un gráfico de clúster es una técnica de visualización que usa distintos gráficos para representar información del
clúster, como el tamaño del clúster, la densidad y la distancia del clúster, la comparación variable del clúster y la
comparación del clúster.
Distribución de clúster
La distrubución del clúster representa el número de observaciones de cada clúster y se representa mediante un
gráfico de barras horizontales. Sin embargo, también puede visualizar la distribución del clúster en un gráfico
circular o en un gráfico de barras verticales.
Densidad y distancia del clúster
La distancia entre los clústeres y la densidad de cada uno se representa mediante un gráfico de redes. Cada nodo
de la red representa un clúster y su tamaño. El color del nodo representa la densidad.
Distribución de características
La comparación de la distribución total de todos los clústeres en relación a la distribución de cada clúster se
representa mediante un histograma. Puede seleccionar la medida necesaria desde Medidasen la sección Datos.
Puede visualizar la distribución de características de cada clúster seleccionando el número de Clústersen la
secciónDatos.
Representación de centro de clúster
El algoritmo de medios K calcula los puntos centrales para las características de cada clúster. La comparación de
cada punto central y clúster se representa mediante un gráfico radial. Por defecto, se muestra el gráfico con
datos normalizados. En el modo normalizado, los datos se representan en un rango de 0 a 1. Sin embargo, puede
deseleccionar la opción Normalizar resultadodesde Opciones.
42
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Analizar datos
10.1.7
Gráfico de nube de etiquetas a priori
El gráfico de nube de etiquetas a priori le permite visualizar y encontrar elementos concretos frecuentes, según la
regla de asociación. En este gráfico de visualización, las reglas más importantes son las más fuertes. La
importancia de las reglas varía según la confianza y el valor de elevación. Cuanto más alto es el valor de confianza
más profundo es el color de las normas y más alto es el valor de elevación y más grande la fuente de las normas.
Puede modificar el valor del soporte, la confianza y los valores de elevación ajustando los controles deslizantes de
rango desde el panel Datos.
10.1.8 Matriz de confusión
Una matriz de confusión contiene información acerca de la clasificación real y predictiva realizada por un
algoritmo, lo que permite visualizar la exactitud. Puede ver el gráfico al seleccionar el método de salida
Clasificación y Tendencia para el algoritmo de árbol CNR. Se trata de una matriz n*n (en la que n es el número de
valores únicos presentes en la columna dependiente seleccionada para el algoritmo), que asigna el número de
sucesos para cada valor previsto teniendo en cuenta el valor real. Las entradas en la diagonal de la matriz
representan la predicción correcta. Las entradas fuera de la diagonal de la matriz representan la clasificación
errónea.
Manual del usuario de SAP Predictive Analysis
Analizar datos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
43
44
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Analizar datos
11
Crear gráficos para visualizar los datos
Usa la ficha de Visualizar para crear gráficos a partir de una gran selección de familias de gráficos. En la ficha
Visualizar, puede acceder a conjuntos de datos predictivos mediante las listas desplegables Análisis y
Componentes. A partir de SAP Predictive Analysis 1.14 en adelante, puede guardar la creación de gráficos
mediante los conjuntos de datos predictivos y compartirlos.
Para obtener más información sobre cómo crear gráficos, consulte la sección Crear gráficos para sus datos en el
Manual de usuario de SAP Lumira disponible en: http://help.sap.com/lumira.
Manual del usuario de SAP Predictive Analysis
Crear gráficos para visualizar los datos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
45
12
Crear guiones para sus datos
Puede crear guiones que proporcionen una narrativa gráfica para describir sus datos al agrupar gráficos en
cuadros para crear cuadros de mandos simples de estilo de presentación. Al agregar imágenes y texto puede
anotar y añadir detalles de la presentación. Puede grabar los guiones como parte del documento.
A partir de SAP Predictive Analysis 1.14 en adelante, puede crear guiones en conjuntos de datos predictivos
mediante las listas desplegables Análisis y Componentes en la ficha Crear.
Para obtener más información sobre cómo crear guiones, consulte la sección Crear guiones para sus datos en el
Manual de usuario de SAP Lumira disponible en: http://help.sap.com/lumira.
46
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Crear guiones para sus datos
13
Compartir gráficos y conjuntos de datos
A partir de SAP Predictive Analysis 1.14 en adelante, puede publicar conjuntos de datos predictivos en SAP HANA,
SAP Streamwork o Explorer, exportar a formatos de archivo de Microsoft Excel o CSV o enviar sus gráficos a sus
colegas por correo electrónico o imprimirlos en formato PDF. En la ficha Compartir, puede acceder a conjuntos de
datos predictivos desde la sección CONJUNTOS DE DATOS.
Para obtener más información sobre cómo compartir gráficos y conjuntos de datos, consulte la sección
Compartir gráficos y conjuntos de datos en el Manual de usuario de SAP Lumira disponible en: http://
help.sap.com/lumira.
Manual del usuario de SAP Predictive Analysis
Compartir gráficos y conjuntos de datos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
47
14 Trabajar con modelos
Un modelo es un componente reutilizable que se crea formando un algoritmo con datos históricos y guardando a
continuación la instancia.
Normalmente creará modelos por los siguientes motivos:
●
Para compartir reglas empresariales de cálculo que se pueden aplicar a datos similares
●
Para predecir datos invisibles utilizando la instacia de formación del algoritmo
14.1 Crear un modelo
Para crear un modelo, debe guardar el estado del algoritmo.
1.
Adquiera datos del origen de datos necesario.
El componente de origen de datos se agrega al editor de análisis en la ficha Predecir.
2.
En la ficha Predecir, haga doble clic en el componente de algoritmo R necesario.
3.
Desde el menú contextual del componente, seleccione Configurar opciones.
4.
Seleccione
5.
Desde el menú contextual del algoritmo, seleccione Guardar como modelo.
6.
Especifique un nombre y una descripción para el modelo.
7.
Si ya existe un modelo con el mismo nombre, seleccione la opción Sobrescribir si existe para sobrescribir el
modelo existente.
8.
Seleccione Guardar.
9.
Seleccione OK.
Ejecutar.
El modelo se crea y aparece en la sección Modelos de la lista Componentes. Puede usar este modelo del mismo
modo que cualquier otro componente para crear un análisis.
Nota
Los nombres de columnas independientes que se usan al calcular el modelo deberían ser los mismos que los
nombres de columnas independientes que se usan al crear el modelo.
14.2 Exportar un modelo como PMML
Puede exportar información del modelo a un archivo local en el formato estándar del sector Predictive Modeling
Markup Language (PMML) y compartir el modelo con otras aplicaciones que admitan PMML para analizar
conjuntos de datos similares.
Para exportar un modelo en el formato PMML, realice los siguientes pasos:
1.
48
Cree un modelo.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Trabajar con modelos
2.
En la fichal Predecir, en la sección Modelos, haga doble clic en el modelo que desee.
3.
Desde el menú contextual del componente, seleccione Exportar modelo.
4.
Seleccione Utilizar esta opción para exportar modelos de datos al archivo Predictive Model Markup Language
(*.pmml).
5.
Seleccione Exportar.
6.
Introduzca un nombre para el archivo.
7.
Seleccione el tipo de archivo, PMML o XML, según sea necesario.
8.
Seleccione Guardar.
14.3 Exportar un modelo a un archivo .spar
Puede exportar un modelo en un archivo .spar y compartirlo con sus compañeros.
Para exportar un modelo, realice los siguientes pasos:
1.
Cree un modelo.
2.
Seleccione el modelo que desee exportar y, de las acciones de componente, seleccione Exportar modelos o
arrastre el modelo en el editor de análisis o del menú contextual, seleccione Exportar modelo.
3.
Seleccione Utilizar esta opción para exportar modelo de datos al archivo (.spar).
4.
Seleccione Exportar.
5.
Introduzca un nombre para el archivo .spar.
6.
Seleccione Guardar.
7.
Seleccione OK.
Para exportar varios modelos a un solo archivo .spar file, seleccione
Seleccione los modelos que desee exportar y seleccione Exportar.
Archivo
Exportar todos los modelos .
14.4 Exportar un modelo PAL de SAP HANA como
procedimiento almacenado
Puede exportar un modelo PAL de SAP HANA como procedimiento almacenado en la base de datos de SAP
HANA y cualquier usuario puede utilizar estos modelos para el análisis.
Antes de exportar un modelo de SAP HANA como modelo almacenado, asegúrese de que su cuenta está definida
en SAP HANA.
1.
Cree un modelo.
2.
En la ficha Predecir, en la lista Componentes, seleccione Modelos.
3.
Seleccione el modelo necesario y, de la sección Acciones de componente, seleccione Exportar modelo.
4.
Seleccione Utilizar esta opción para exportar un modelo de SAP HANA como procedimiento almacenado.
5.
Seleccione Exportar.
Manual del usuario de SAP Predictive Analysis
Trabajar con modelos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
49
6.
Seleccione el esquema necesario en el que desee que aparezca el procedimiento.
7.
Especifique un nombre para el procedimiento.
Nota
Si desea sobrescribir el procedimiento existente con el mismo nombre en el esquema seleccionado,
seleccione Sobrescribir si existe.
8.
Seleccione Exportar.
El procedimiento exportado y los objetos asociados al procedimiento (tablas/tipos) aparecen en el esquema
seleccionado en la base de datos de SAP HANA.
14.4.1 Eliminar el procedimiento almacenado exportado de
SAP HANA
Puede eliminar el procedimiento almacenado exportado de SAP HANA mediante SAP HANA Studio. Asegúrese de
que la cuenta está definida en SAP HANA.
Para eliminar el procedimiento almacenado exportado de SAP HANA, lleve a cabo los siguientes pasos:
1.
En SAP HANA Studio, desplácese al procedimiento que ha exportado.
Nota
Puede encontrar el procedimiento exportado en la carpeta Procedure del esquema.
2.
Haga clic con el botón derecho en el procedimiento y seleccione Abrir definición.
Aparece la ficha Definición.
3.
En la ficha Definición, seleccione la ficha Crear declaración.
4.
En la ficha Crear declaración, copie los comentarios SQL (comandos precedidos por guiones dobles '--').
5.
En la ficha Navegación, haga clic con el botón derecho en el procedimiento y seleccione Consola SQL.
Aparece la ficha Consola SQL.
6.
En la ficha Consola SQL, pegue los comentarios SQL y seleccione Ejecutar o pulse F8.
Nota
Asegúrese de eliminar los guiones dobles (- -), que preceden a los comentarios SQL, antes de ejecutar los
comentarios.
14.5 Importar un modelo
Puede importar un modelo compartido por su compañero y utilizarlo de análisis.
Para importar un modelo, realice los siguientes pasos:
50
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Trabajar con modelos
1.
En la pestañaPredecir, en la lista de Componentes, seleccione
Importar modelo .
2.
Seleccione un archivo .spar válido y, a continuación, seleccione Abrir.
3.
Seleccione los modelos que desee importar y seleccione Finalizar.
El modelo se importa y aparece en la sección Modelos de la lista Componentes.
14.6 Eliminar un modelo
Le recomendamos que use esta opción con precaución, dado que la eliminación de un modelo puede inutilizar los
análisis que contienen referencias al modelo.
Para eliminar un modelo, realice los siguientes pasos:
1.
En la ficha Predecir, en la lista Componentes, seleccione Modelos.
2.
Seleccione el modelo necesario y, de las acciones de componente, seleccione Eliminar.
Manual del usuario de SAP Predictive Analysis
Trabajar con modelos
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
51
15
Propiedades de los componentes
15.1
Algoritmos
Use algoritmos para realizar tareas de minería y análisis estadísticos de datos. Por ejemplo, para determinar
cuáles son las tendencias y los patrones de los datos.
SAP Predictive Analysis ofrece algoritmos integrados como regresiones, series temporales y valores atípicos. Sin
embargo, la aplicación también admite algoritmos de árboles de decisiones, medios K, red neuronal, series
temporales y regresión de la biblioteca R de código abierto. También puede realizar análisis dentro de la base de
datos con algoritmos de la Biblioteca de Predictive Analysis (PAL) desde SAP HANA.
15.1.1
Regresión
15.1.1.1
Regresión exponencial de HANA
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina la forma en la que una variable concreta influye en otra variable mediante una función
exponencial.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de
datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión exponencial de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columnas independientes
Seleccione las columnas de entrada con las que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
52
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Ignorar: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Mantener el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Nombre de columna prevista
Introduzca un nombre para la columna recién añadida que contiene los valores previstos.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 1.
15.1.1.2
Regresión geométrica de HANA
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina la forma en la que una variable concreta influye en otra variable mediante una función
geométrica.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión geométrica de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columnas independientes
Seleccione las columnas de entrada con las que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
53
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Nombre de columna prevista
Introduzca un nombre para la columna recién añadida que contiene los valores previstos.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 1.
15.1.1.3
Regresión lineal múltiple de HANA
Sintaxis
Use este algoritmo para buscar la relación lineal entre una variable dependiente y una o varias variables
independientes.
Propiedades de la regresión lineal múltiple de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columnas independientes
Seleccione las columnas de entrada con las que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
54
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 1.
15.1.1.4
Regresión logarítmica de HANA
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza análisis de regresión
logarítmica de bivariable. Determina el modo en que una variable individual influye en otra variable mediante la
función logarítmica de la Biblioteca de Predictive Analysis (PAL).
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión logarítmica de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columna independiente
Seleccione las columnas de entrada con las que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Nombre de columna prevista
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
55
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 1.
15.1.1.5
Regresión polinómica de HANA
Sintaxis
Use este algoritmo para buscar la relación entre la variable independiente y la variable dependiente de una
línea ajustada curvilínea.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión polinomial de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columnas independientes
Seleccione las columnas de entrada con las que desea realizar la regresión.
Grado del ajuste polinomial
Introduzca el mayor valor exponencial de una expresión polinomial.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Ignorar: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Mantener el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Nombre de columna prevista
56
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 1.
15.1.1.6
Regresión lineal múltiple R de HANA
Sintaxis
Use este algoritmo para buscar la relación lineal entre una variable dependiente y una o varias variables
independientes.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión lineal múltiple R de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columnas independientes
Seleccione las columnas de entrada con las que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Nivel de confianza
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
57
Introduzca el nivel de confianza del algoritmo (la precisión de las predicciones). El valor
predeterminado es 0,95.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
15.1.1.7
Regresión logística de HANA
Sintaxis
Use este algoritmo cuando las variables independientes son categóricas o una mezcla de valores continuos y
categóricos. La Regresión logística es un enfoque de predicción parecido a la regresión de Mínimos cuadrados
ordinarios (OLS).
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión logística de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
●
Relleno: rellena los valores faltantes en la columna de destino.
Columnas independientes
Seleccione las columnas de entrada con las que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Procedimiento de iteración
Seleccione el procedimiento de iteración.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
58
●
Ignorar: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Mantener el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Visualizar valores ajustados
Seleccione la opción para ver los valores ajustados en una nueva columna.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Repetición máxima
Indique la cantidad máxima de repeticiones permitidas para calcular el coeficiente del
algoritmo. El valor predeterminado es 100.
Umbral de salida
Introduzca el valor de umbral para salir de las repeticiones. El valor predeterminado es
0,00001.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 4.
Valor de asignación para 0
Indique un valor para una variable, el cual estará asignado a 0.
Valor de asignación para 1
Indique un valor para una variable, el cual estará asignado a 1.
15.1.1.8
Regresión exponencial R
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina el modo en que una única variable influye en otra variable mediante una función
exponencial de la biblioteca de código abierto R.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión exponencial R
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
59
Columna independiente
Seleccione la columna de entrada con la que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Ignorar: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Permitir ajuste singular
Valor booleano; si se define con el valor verdadero, los coeficientes con alias se pasan por
alto en la matriz de covarianza de coeficientes. Si se define con el valor falso, los modelos
con coeficientes con alias producen un error.
Un modelo con coeficientes con alias significa que la matriz cuadrada x*x es singular.
Contrastes
Seleccione la lista de contrastes que desea usar para los factores que aparecen como
variables en el modelo.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
15.1.1.9
Regresión geométrica R
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina el modo en que una única variable influye en otra variable mediante una función
geométrica de la biblioteca de código abierto R.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión geométrica R
Modo de salida
60
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columna independiente
Seleccione la columna de entrada con la que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Ignorar: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Permitir ajuste singular
Valor booleano; si se define con el valor verdadero, los coeficientes con alias se pasan por
alto en la matriz de covarianza de coeficientes. Si se define con el valor falso, los modelos
con coeficientes con alias producen un error.
Un modelo con coeficientes con alias significa que la matriz cuadrada x*x es singular.
Contrastes
Seleccione la lista de contrastes que desea usar para los factores que aparecen como
variables en el modelo.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
15.1.1.10 Regresión lineal R
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina el modo en que una única variable influye en otra variable mediante la biblioteca de
código abierto R.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
61
Propiedades de la regresión lineal R
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columna independiente
Seleccione la columna de entrada con la que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Ignorar: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Permitir ajuste singular
Valor booleano; si se define con el valor verdadero, los coeficientes con alias se pasan por
alto en la matriz de covarianza de coeficientes. Si se define con el valor falso, los modelos
con coeficientes con alias producen un error.
Un modelo con coeficientes con alias significa que la matriz cuadrada x*x es singular.
Contrastes
Seleccione la lista de contrastes que desea usar para los factores que aparecen como
variables en el modelo.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
15.1.1.11 Regresión logarítmica R
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina el modo en que una única variable influye en otra variable mediante una función
logarítmica de la biblioteca de código abierto R.
62
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión logarítmica R
Modo de salida
Seleccione el modo en el que desea mostrar los datos de salida.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columna independiente
Seleccione la columna de origen de entrada con la que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino en la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Valores posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Permitir ajuste singular
Valor booleano; si se define con el valor verdadero, los coeficientes con alias se pasan por
alto en la matriz de covarianza de coeficientes. Si se define con el valor falso, los modelos
con coeficientes con alias producen un error.
Un modelo con coeficientes con alias significa que la matriz cuadrada x*x es singular.
Contrastes
Seleccione la lista de contrastes que se va a usar para los factores que aparecen como
variables en el modelo.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
63
15.1.1.12 Regresión lineal múltiple R
Sintaxis
Use este algoritmo para buscar la relación lineal entre una variable dependiente y una o varias variables
independientes.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión lineal múltiple R
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columnas independientes
Seleccione las columnas de entrada con las que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: conserva los valores que faltan.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna dependiente o
independiente.
Nivel de confianza
Indique el nivel de confianza del algoritmo. El valor predeterminado es 0,95.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
64
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
15.1.1.13 Regresión exponencial
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina cómo una variable individual influencia a otra variable mediante una función
exponencial con la metodología de mínimo cuadrado.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión exponencial
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Modos posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columna independiente
Seleccione la columna de entrada con la que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
65
15.1.1.14 Regresión geométrica
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina cómo una variable individual influencia a otra variable mediante una función
geométrica con la metodología de mínimo cuadrado.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión geométrica
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columna independiente
Seleccione la columna de entrada con la que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Detener: El algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Nombre de columna prevista
Introduzca un nombre para la columna creada recientemente que contiene los valores
previstos.
66
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
15.1.1.15 Regresión lineal
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina cómo una variable individual influencia a otra variable mediante la metodología de
mínimo cuadrado.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión lineal
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columna independiente
Seleccione la columna de entrada con la que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Valores posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
67
15.1.1.16 Regresión logarítmica
Sintaxis
Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una
sola variable. Determina cómo una variable individual influencia a otra variable mediante una función
logarítmica con la metodología de mínimo cuadrado.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de la regresión logarítmica
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Relleno: rellena los valores faltantes en la columna de destino.
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
Columna independiente
Seleccione la columna de entrada con la que desea realizar la regresión.
Columna dependiente
Seleccione la columna de destino para la que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Ignorar: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
68
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
15.1.2
Valores atípicos
15.1.2.1
Detección de anomalías de HANA
Sintaxis
Use este algoritmo para buscar modelos en los datos que no se ajusten al comportamiento previsto.
Nota
No se admite la creación de modelos mediante el algoritmo de detección de anomalías de HANA.
Propiedades de la detección de anomalías de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Columnas independientes
Seleccione las columnas de origen de entrada.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Valores posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Porcentaje de anomalías
Introduzca el porcentaje del valor que indica la proporción de anomalías que hay en los
datos de origen. El valor predeterminado es 10.
Método de detección de anomalías
Seleccione el método de detección de anomalías.
●
Por distancia del centro
●
Por la suma de distancias de todos los centros
Repeticiones máximas
Introduzca el número de repeticiones permitidas para buscar clústeres. El valor
predeterminado es 100.
Método de cálculo central
Seleccione el método para calcular los centros del clúster inicial.
Tipo de normalización
Seleccione el tipo de normalización.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
69
Número de clústeres
Introduzca el número de grupos para la agrupación en clúster.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 1.
Umbral de salida
Introduzca el valor de umbral para salir de las repeticiones. El valor predeterminado es
0,0001.
Medición de distancia
Introduzca el medidor para calcular la distancia entre el elemento y el centro del clúster.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores previstos.
15.1.2.2
Prueba de rangos intercuartil de HANA
Sintaxis
Use este algoritmo para encontrar valores atípicos según la distribución estadística entre el primer y el tercer
cuartil.
Nota
●
Los datos de entrada del algoritmo de la prueba IQR (rangos intercuartil) deben tener como mínimo
cuatro filas.
●
No se admite la creación de modelos mediante el algoritmo de prueba del rango intercuartil de HANA.
Propiedades de la prueba de rangos intercuartil de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Mostrar valores atípicos: agrega una columna booleana a los datos de entrada donde
se especifica si el valor correspondiente es un valor atípico.
●
Eliminar valores atípicos: elimina los valores atípicos de los datos de entrada.
Columna independiente
Seleccione una columna de origen de entrada.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
70
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Coeficiente Fence
Introduzca la desviación permitida para los valores desde el rango intercuartil. El valor
predeterminado es 1,5.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores previstos.
15.1.2.3
Rango intercuartil
Sintaxis
Use este algoritmo para encontrar valores atípicos según la distribución estadística entre el primer y el tercer
cuartil.
Nota
●
Los datos de entrada del algoritmo de IQR (rango intercuartil) deben tener como mínimo cuatro filas.
●
No se admite la creación de modelos mediante el algoritmo de rango intercuartil.
Propiedades del rango intercuartil
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Mostrar valores atípicos: agrega una columna booleana a los datos de entrada donde
se especifica si el valor correspondiente es un valor atípico.
●
Eliminar valores atípicos: elimina los valores atípicos de los datos de entrada.
Característica
Seleccione la columna de entrada con la que desea realizar el análisis.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
71
Coeficiente Fence
Introduzca la desviación permitida para los valores desde el rango intercuartil. El valor
predeterminado es 1.5.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores previstos.
15.1.2.4
Valor atípico de vecino más próximo
Sintaxis
Use este algoritmo para buscar valores atípicos según el número de vecinos (N) y la distancia promedia de los
valores comparados con los vecinos N más próximos.
Nota
No se admite la creación de modelos mediante el valor atípico de vecino más próximo.
Propiedades del valor atípico de vecino más próximo
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Mostrar valores atípicos: agrega una columna booleana a los datos de entrada donde
se especifica si el valor correspondiente es un valor atípico.
●
Eliminar valores atípicos: elimina los valores atípicos de los datos de entrada.
Característica
Seleccione la columna de entrada con la que desea realizar el análisis.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Recuento de vecinos
Introduzca el número de vecinos para encontrar distancias. El valor predeterminado es 5.
Número de valores atípicos
Introduzca el número de valores atípicos que desea eliminar.
Nombre de columna prevista
72
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Introduzca un nombre para la nueva columna que contiene los valores previstos.
15.1.2.5
Prueba de varianza de HANA
Sintaxis
La prueba de varianza de HANA identifica los valores atípicos de un conjunto de datos numéricos. Los límites
superior e inferior de los datos se calculan según en medio y la desviación estándar de los datos y el valor de
multiplicador que se proporcione.
El multiplicador es un coeficiente de tipo doble, que ayuda a probar si los valores de un vector numérico están
dentro del rango.
Si el valor se encuentra fuera del rango, sugiere que no pasa la prueba de varianza y, por lo tanto, el valor se
marca como un valor atípico.
Nota
No se admite la creación de modelos mediante el algoritmo de detección de anomalías de HANA.
Propiedades de la prueba de varianza de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Mostrar valores atípicos: agrega una columna booleana a los datos de entrada donde
se especifica si el valor correspondiente es un valor atípico.
●
Eliminar valores atípicos: elimina los valores atípicos de los datos de entrada.
Columnas independientes
Seleccione las columnas de origen de entrada.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Multiplicador
Indique el valor de multiplicador para decidir el rango del los límites inferior y superior, el
cual le ayudará a identificar los valores atípicos. El valor predeterminado es 3,0.
Nota
El valor de entrada debe ser un valor entero.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
73
Número de subprocesos
Indique la cantidad de subprocesos que debe usar el algoritmo durante la ejecución.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores previstos.
15.1.3
Serie temporal
15.1.3.1
Suavizado exponencial único de HANA
Sintaxis
Use este algoritmo para suavizar los datos de origen.
Nota
No se admite la creación de modelos mediante el algoritmo de suavizado exponencial único de HANA.
Propiedades del suavizado exponencial único de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto
de datos determinado.
●
Previsión: muestra los valores previstos de un período determinado.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo.
Período
Seleccione el período para la predicción.
Períodos por año
Seleccione el período para la predicción. Esta opción solo esta activada si selecciona
"Personalizar" para "Período".
Año inicial
Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009,
1987, 2019.
Período de inicio
Introduzca el período del que se deben tener en cuenta las observaciones. El valor
predeterminado es 1.
Períodos para predecir
74
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Introduzca el número de períodos para prever. Este valor se utiliza únicamente si el modo
de salida es Previsión.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Valores de año
Introduzca un nombre para la columna recién creada que contiene los valores de año.
Valores de trimestre
Introduzca un nombre para la columna recién creada que contiene los valores de
trimestre.
Valores de mes
Introduzca un nombre para la columna recién creada que contiene los valores de mes.
Valores de período
Introduzca un nombre para la columna recién creada que contiene los valores de período.
Alfa
Introduzca una constante de suavizado para suavizar las observaciones (parámetros de
base). Rango: 0-1.
15.1.3.2
Suavizado exponencial doble de HANA
Sintaxis
Use este algoritmo para suavizar los datos de origen.
Nota
No se admite la creación de modelos mediante el algoritmo de suavizado exponencial doble de HANA.
Propiedades del suavizado exponencial doble de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto
de datos determinado.
●
Previsión: muestra los valores previstos de un período determinado.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo.
Período
Seleccione el período para la predicción.
Períodos por año
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
75
Seleccione el período para la predicción. Esta opción solo esta activada si selecciona
"Personalizar" para "Período".
Año inicial
Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009,
1987, 2019.
Período de inicio
Introduzca el período del que se deben tener en cuenta las observaciones.
Períodos para predecir
Introduzca el número de períodos para prever. Este valor se utiliza únicamente si el modo
de salida es Previsión.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Valores de año
Introduzca un nombre para la columna recién creada que contiene los valores de año.
Valores de trimestre
Introduzca un nombre para la columna recién creada que contiene los valores de
trimestre.
Valores de mes
Introduzca un nombre para la columna recién creada que contiene los valores de mes.
Valores de período
Introduzca un nombre para la columna recién creada que contiene los valores de período.
Alfa
Introduzca una constante de suavizado para suavizar las observaciones (parámetros de
base). Rango: 0-1.
Beta
Introduzca una constante de suavizado para buscar parámetros de tendencias. Rango:
0-1.
15.1.3.3
Suavizado exponencial triple de HANA
Sintaxis
Use este algoritmo para suavizar los datos de origen y descubrir tendencias estacionales en los datos.
Nota
No se admite la creación de modelos mediante el algoritmo de suavizado exponencial triple de HANA.
76
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Propiedades del suavizado exponencial triple de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto
de datos determinado.
●
Previsión: muestra los valores previstos de un período determinado.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo.
Período
Seleccione el período para la predicción.
Períodos por año
Seleccione el período para la predicción. Esta opción solo esta activada si selecciona
"Personalizar" para "Período".
Año inicial
Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009,
1987, 2019.
Período de inicio
Introduzca el período del que se deben tener en cuenta las observaciones.
Períodos para predecir
Introduzca el número de períodos para prever. Este valor se utiliza únicamente si el modo
de salida es Previsión.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Valores de año
Introduzca un nombre para la columna recién creada que contiene los valores de año.
Valores de trimestre
Introduzca un nombre para la columna recién creada que contiene los valores de
trimestre.
Valores de mes
Introduzca un nombre para la columna recién creada que contiene los valores de mes.
Valores de período
Introduzca un nombre para la columna recién creada que contiene los valores de período.
Alfa
Introduzca una constante de suavizado para suavizar las observaciones (parámetros de
base). Rango: 0-1.
Beta
Introduzca una constante de suavizado para buscar parámetros de tendencias. Rango:
0-1.
Gamma
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
77
Introduzca una constante de suavizado para buscar parámetros de tendencias
estacionales. Rango: 0-1.
15.1.3.4
Suavizado exponencial triple R de HANA
Sintaxis
Use este algoritmo para suavizar los datos de origen y descubrir tendencias estacionales en los datos.
Propiedades del suavizado exponencial triple R de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto
de datos determinado.
●
Previsión: muestra los valores previstos de un período determinado.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo.
Período
Seleccione el período para la predicción.
Períodos por año
Seleccione el período para la predicción. Esta opción solo esta activada si selecciona
"Personalizar" para "Período".
Año inicial
Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009,
1987, 2019.
Período de inicio
Introduzca el período del que se deben tener en cuenta las observaciones.
Períodos para predecir
Introduzca el número de períodos para prever. Este valor se utiliza únicamente si el modo
de salida es Previsión.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Valores de año
Introduzca un nombre para la columna recién creada que contiene los valores de año.
Valores de trimestre
Introduzca un nombre para la columna recién creada que contiene los valores de
trimestre.
Valores de mes
78
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Introduzca un nombre para la columna recién creada que contiene los valores de mes.
Valores de período
Introduzca un nombre para la columna recién creada que contiene los valores de período.
Alfa
Introduzca una constante de suavizado para suavizar las observaciones (parámetros de
base). Rango: 0-1.
Beta
Introduzca una constante de suavizado para buscar parámetros de tendencias. Rango:
0-1.
Gamma
Introduzca una constante de suavizado para buscar parámetros de tendencias
estacionales. Rango: 0-1.
Estacionario
Seleccione el tipo de algoritmo de suavizado exponencial HoltWinters.
Nivel de confianza
Indique el nivel de confianza del algoritmo.
Número de observaciones periódicas
Introduzca el número de observaciones periódicas necesarias para iniciar el cálculo.
Nivel
Introduzca el valor de inicio del nivel (a[0]) (l.start). Por ejemplo: 0.4
Tendencia
Introduzca el valor de inicio para descubrir parámetros de tendencias (b[0]) (b.start). Por
ejemplo: 0.4
Estación
Introduzca los valores de inicio para descubrir parámetros estacionales (s.start). Este
valor depende de la columna que se seleccione. Por ejemplo, si selecciona trimestre como
período, tiene que proporcionar cuatro valores dobles.
Entradas de optimizador
Introduzca los valores de inicio de alfa, beta y gamma necesarios para el optimizador. Por
ejemplo: 0.3, 0.1, 0.1
15.1.3.5
Suavizado exponencial único R
Sintaxis
Use este algoritmo para suavizar los datos de origen.
Nota
No se admite la creación de modelos mediante el algoritmo de suavizado exponencial único R de HANA.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
79
Propiedades del suavizado exponencial único R
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto
de datos determinado.
●
Previsión: muestra los valores previstos de un período determinado.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo.
Período
Seleccione el período para la predicción.
Períodos por año
Seleccione el período para la predicción. Esta opción solo esta activada si selecciona
"Personalizar" para "Período".
Año inicial
Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009,
1987, 2019.
Período de inicio
Introduzca el período del que se deben tener en cuenta las observaciones.
Períodos para predecir
Introduzca el número de períodos para predecir.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Valores de año
Introduzca un nombre para la columna recién creada que contiene los valores de año.
Valores de trimestre
Introduzca un nombre para la columna recién creada que contiene los valores de
trimestre.
Valores de mes
Introduzca un nombre para la columna recién creada que contiene los valores de mes.
Valores de período
Introduzca un nombre para la columna recién creada que contiene los valores de período.
Alfa
Introduzca una constante de suavizado para suavizar las observaciones (parámetros de
base). El valor predeterminado es 0,3. Rango: 0-1.
Nivel de confianza
Indique el nivel de confianza del algoritmo.
Número de observaciones periódicas
Introduzca el número de observaciones periódicas necesarias para iniciar el cálculo. El
valor predeterminado es 2.
Nivel
80
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Introduzca el valor de inicio del nivel (a[0]) (l.start). Por ejemplo: 0.4
15.1.3.6
Suavizado exponencial doble R
Sintaxis
Use este algoritmo para suavizar los datos de origen y descubrir tendencias en los datos.
Nota
No se admite la creación de modelos mediante el algoritmo de suavizado exponencial doble R de HANA.
Propiedades del suavizado exponencial doble R
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto
de datos determinado.
●
Previsión: muestra los valores previstos de un período determinado.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo.
Período
Seleccione el período para la predicción.
Períodos por año
Seleccione el período para la predicción. Esta opción solo esta activada si selecciona
"Personalizar" para "Período".
Año inicial
Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009,
1987, 2019.
Período de inicio
Introduzca el período del que se deben tener en cuenta las observaciones.
Períodos para predecir
Introduzca el número de períodos para predecir.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Valores de año
Introduzca un nombre para la columna recién creada que contiene los valores de año.
Valores de trimestre
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
81
Introduzca un nombre para la columna recién creada que contiene los valores de
trimestre.
Valores de mes
Introduzca un nombre para la columna recién creada que contiene los valores de mes.
Valores de período
Introduzca un nombre para la columna recién creada que contiene los valores de período.
Alfa
Introduzca una constante de suavizado para suavizar las observaciones (parámetros de
base). El valor predeterminado es 0,3. Rango: 0-1.
Beta
Introduzca una constante de suavizado para buscar parámetros de tendencias. El valor
predeterminado es 0,1. Rango: 0-1.
Nivel de confianza
Indique el nivel de confianza del algoritmo.
Número de observaciones periódicas
Introduzca el número de observaciones periódicas necesarias para iniciar el cálculo. El
valor predeterminado es 2.
Nivel
Introduzca el valor de inicio del nivel (a[0]) (l.start). Por ejemplo: 0.4
Tendencia
Introduzca el valor de inicio para descubrir parámetros de tendencias (b[0]) (b.start). Por
ejemplo: 0.4
Entradas de optimizador
Introduzca los valores de inicio de alfa, beta y gamma necesarios para el optimizador. Por
ejemplo: 0.3, 0.1, 0.1
15.1.3.7
Suavizado exponencial triple R
Sintaxis
Use este algoritmo para suavizar los datos de origen y descubrir tendencias estacionales en los datos.
Nota
No se admite la creación de modelos mediante el algoritmo de suavizado exponencial triple R de HANA.
Propiedades del suavizado exponencial triple R
Modo de salida
82
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto
de datos determinado.
●
Previsión: muestra los valores previstos de un período determinado.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo.
Período
Seleccione el período para la predicción.
Períodos por año
Seleccione el período para la predicción. Esta opción solo esta activada si selecciona
"Personalizar" para "Período".
Año inicial
Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009,
1987, 2019.
Período de inicio
Introduzca el período del que se deben tener en cuenta las observaciones.
Períodos para predecir
Introduzca el número de períodos para predecir.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Valores de año
Introduzca un nombre para la columna recién creada que contiene los valores de año.
Valores de trimestre
Introduzca un nombre para la columna recién creada que contiene los valores de
trimestre.
Valores de mes
Introduzca un nombre para la columna recién creada que contiene los valores de mes.
Valores de período
Introduzca un nombre para la columna recién creada que contiene los valores de período.
Alfa
Introduzca una constante de suavizado para suavizar las observaciones (parámetros de
base). El valor predeterminado es 0,3. Rango: 0-1.
Beta
Introduzca una constante de suavizado para buscar parámetros de tendencias. El valor
predeterminado es 0,1. Rango: 0-1.
Gamma
Introduzca una constante de suavizado para buscar parámetros de tendencias
estacionales. El valor predeterminado es 0,1.
Estacionario
Seleccione el tipo de algoritmo de suavizado exponencial HoltWinters.
Nivel de confianza
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
83
Indique el nivel de confianza del algoritmo.
Número de observaciones periódicas
Introduzca el número de observaciones periódicas necesarias para iniciar el cálculo. El
valor predeterminado es 2.
Nivel
Introduzca el valor de inicio del nivel (a[0]) (l.start). Por ejemplo: 0.4
Tendencia
Introduzca el valor de inicio para descubrir parámetros de tendencias (b[0]) (b.start). Por
ejemplo: 0.4
Estación
Introduzca los valores de inicio para descubrir parámetros estacionales (s.start). Este
valor depende de la columna que se seleccione. Por ejemplo, si selecciona trimestre como
período, tiene que proporcionar cuatro valores dobles.
Entradas de optimizador
Introduzca los valores de inicio de alfa, beta y gamma necesarios para el optimizador. Por
ejemplo: 0.3, 0.1, 0.1
15.1.3.8
Triple Exponential Smoothing
Sintaxis
Use this algorithm to smooth the source data and find seasonal trends in data.
Triple Exponential Smoothing Properties
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
●
Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto
de datos determinado.
●
Previsión: muestra los valores previstos de un período determinado.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo.
Tener en cuenta columna de fecha
Seleccione esta opción para especificar si se va a usar la columna de fecha.
Columna de fecha
Introduzca el nombre de la columna que contiene los valores de fecha.
Período
Seleccione el período para la predicción.
Períodos por año
84
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Seleccione el período para la predicción. Esta opción solo esta activada si selecciona
"Personalizar" para "Período".
Año inicial
Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009,
1987, 2019.
Período de inicio
Introduzca el período del que se deben tener en cuenta las observaciones.
Períodos para predecir
Introduzca el número de períodos para predecir.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Valores de año
Introduzca un nombre para la columna recién creada que contiene los valores de año.
Valores de trimestre
Introduzca un nombre para la columna recién creada que contiene los valores de
trimestre.
Valores de mes
Introduzca un nombre para la columna recién creada que contiene los valores de mes.
Valores de período
Introduzca un nombre para la columna recién creada que contiene los valores de período.
Alfa
Introduzca una constante de suavizado para suavizar las observaciones (parámetros de
base). El valor predeterminado es 0,3. Rango: 0-1.
Beta
Introduzca una constante de suavizado para buscar parámetros de tendencias. El valor
predeterminado es 0,1. Rango: 0-1.
Gamma
Introduzca una constante de suavizado para buscar parámetros de tendencias
estacionales. El valor predeterminado es 0,1. Rango: 0-1.
15.1.4
Árboles de decisiones
15.1.4.1
HANA C 4.5
Sintaxis
Use este algoritmo para clasificar las observaciones en grupos y predecir una o varias variables discretas
según otras variables.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
85
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de HANA C 4.5
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
●
Relleno: rellena los valores faltantes en la columna de destino.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino
Seleccione la columna de destino para la que desea realizar el análisis.
Nota
Solo acepta columnas con el tipo de datos enteros.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Porcentaje de datos de entrada
Introduzca el porcentaje de datos que desee considerar para el análisis.
División mínima
Introduzca el número de registros a partir del cual no se permite la división del nodo de
hojas. El valor predeterminado es 0.
Columnas
Seleccione las columnas independientes que contengan los valores numéricos.
Rangos de agrupamiento
Introduzca los rangos de agrupamiento.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene el valor previsto.
86
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 1.
15.1.4.2
Árbol HANA R-CNR
Sintaxis
Use este algoritmo para clasificar las observaciones en grupos y predecir una o varias variables discretas
según otras variables. Sin embargo, puede utilizar este algoritmo para encontrar tendencias en los datos.
Nota
●
El paquete "rpart" que forma parte de R 2.15 no puede tratar los nombres de columnas que contienen
espacios o caracteres especiales. El paquete "rpart" solo es compatible con el formato del nombre de la
columna de entrada compatible con el marco de datos R.
●
Los nombres de la columna independiente que se usen al puntuar el modelo deben ser los mismos que
los nombres de la columna independiente que se usó al crear el modelo.
●
No se admiten los nombres de columnas que contienen espacios y otros caracteres especiales
diferentes al punto (.)
Propiedades del árbol HANA R-CNR
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
●
Relleno: rellena los valores faltantes en la columna de destino.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino
Seleccione la columna de destino para la que desea realizar el análisis.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Valores posibles:
●
Omitir: El algoritmo omite los registros que contienen valores perdidos en la columna
independiente o la columna dependiente.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
87
Tipo de algoritmo:
Seleccione el tipo de análisis que desee que ejecute el algoritmo.
Valores posibles:
●
Clasificación: utilice este método si la variable dependiente tiene valores categóricos.
●
Regresión: utilice este método si la variable dependiente tiene valores numéricos.
División mínima
Introduzca el número mínimo de observaciones necesarios para dividir un nodo. El valor
predeterminado es 10.
Dividir criterios
Seleccione el criterio de división del nodo.
Valores posibles:
●
Gini: impurezas gini.
●
Información: ganancia de información
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Parámetro de complejidad
Introduzca el parámetro de complejidad que guarda el tipo de cálculo al evitar las
divisiones que no mejoran el ajuste. El valor predeterminado es 0,005.
Profundidad máxima
Introduzca el nivel de nodo máximo en el árbol final con el nodo de raíz contado como nivel
0.
Nota
Si la profundidad máxima es mayor de 30, el algoritmo no producirá los resultados
esperados (en máquinas de 32 bits).
Validación cruzada
Introduzca el número de validaciones cruzadas. Un valor de validación cruzada mayor
incrementará el tiempo de computación y producirá resultados más precisos.
Probabilidad anterior
Introduzca el vector de probabilidades anteriores.
Usar subrogado
Seleccione el subrogado que se usará en el proceso de división.
Valores posibles:
●
Mostrar solo - una observación con un valor faltante en la regla de división primaria no
se reproducirá en el árbol.
●
Usar subrogado: utilice esta opción para dividir sujetos faltantes en la variable
primaria. Si faltan todos los subrogados, la observación no se dividirá.
●
Detener si falta: si faltan todos los subrogados, se enviará una observación en la
dirección de la mayoría.
Estilo del subrogado
88
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Introduzca el estilo que controla la selección del mejor subrogado.
Valores posibles:
●
Usar clasificación correcta total: el algoritmo usa el número total de clasificaciones
correctas para encontrar una posible variable subrogada.
●
Usar porcentaje de casos no faltantes: el algoritmo usa el porcentaje de casos no
faltantes clasificados para encontrar un posible subrogado.
Subrogado máximo
Introduzca el número máximo de subrogados que se deben conservar en cada nodo de un
árbol.
Mostrar probabilidad
Seleccione la casilla de verificación Mostrar probabilidad para obtener la probabilidad de
los valores previstos durante el cálculo de un modelo de clasificación.
15.1.4.3
CHAID HANA
Sintaxis
CHAID representa la detección de la interacción automática de Chi al cuadrado. Es un método de clasificación
para crear árboles de decisiones mediante estadísticas de Chi al cuadrado para identificar las divisiones
óptimas.
Nota
El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo
de datos de las columnas que se usan al elaborar el modelo.
Propiedades de CHAID HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
●
Relleno: rellena los valores faltantes en la columna de destino.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino
Seleccione la columna de destino para la que desea realizar el análisis.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
89
Nota
Solo acepta columnas con el tipo de datos enteros.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Valores posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Porcentaje de datos de entrada
Introduzca el porcentaje de datos que se tendrán en cuenta para el análisis.
División mínima
Introduzca el número mínimo de registros para un nodo, más allá del cual no se permite la
división ese nodo concreto. El valor predeterminado es 0.
Profundidad máxima
Introduzca la profundidad máxima del árbol.
Nombre de columna
Seleccione el nombre de la columna independiente que contiene los valores numéricos.
Introducir rangos de agrupamiento
Introduzca los rangos de agrupamiento.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores previstos.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución.
15.1.4.4
Árbol CNR R
Sintaxis
Use este algoritmo para clasificar las observaciones en grupos y predecir una o varias variables discretas
según otras variables. Sin embargo, puede utilizar este algoritmo para encontrar tendencias en los datos.
Nota
90
●
El paquete "rpart" que forma parte de R 2.15 no puede tratar los nombres de columnas que contienen
espacios o caracteres especiales. El paquete "rpart" solo es compatible con el formato del nombre de la
columna de entrada compatible con el marco de datos R.
●
Los nombres de la columna independiente que se usen al puntuar el modelo deben ser los mismos que
los nombres de la columna independiente que se usó al crear el modelo.
●
No se admiten los nombres de columnas que contienen espacios y otros caracteres especiales
diferentes al punto (.)
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Propiedades del árbol R-CNR
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
●
Relleno: rellena los valores faltantes en la columna de destino.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino
Seleccione la columna de destino para la que desea realizar el análisis.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Rpart: el algoritmo elimina todas las observaciones que le faltan a la columna
dependiente. Sin embargo, retiene estas observaciones en aquellas columnas
independientes que falten.
●
Omitir: El algoritmo omite los registros que contienen valores perdidos en la columna
independiente o la columna dependiente.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
●
Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente
o en la columna dependiente.
Tipo de algoritmo:
Seleccione el tipo de análisis que desee que ejecute el algoritmo.
Valores posibles:
●
Clasificación: utilice este método si la variable dependiente tiene valores categóricos.
●
Regresión: utilice este método si la variable dependiente tiene valores numéricos.
División mínima
Introduzca el número mínimo de observaciones necesarios para dividir un nodo. El valor
predeterminado es 10.
Dividir criterios
Seleccione el criterio de división del nodo.
Valores posibles:
●
Gini: impurezas gini.
●
Información: ganancia de información
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Parámetro de complejidad
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
91
Introduzca el parámetro de complejidad que guarda el tipo de cálculo al evitar las
divisiones que no mejoran el ajuste. El valor predeterminado es 0,005.
Profundidad máxima
Introduzca el nivel de nodo máximo en el árbol final con el nodo de raíz contado como nivel
0.
Nota
Si la profundidad máxima es mayor de 30, el algoritmo no producirá los resultados
esperados (en máquinas de 32 bits).
Validación cruzada
Introduzca el número de validaciones cruzadas. Un valor de validación cruzada mayor
incrementará el tiempo de computación y producirá resultados más precisos.
Probabilidad anterior
Introduzca el vector de probabilidades anteriores.
Usar subrogado
Seleccione el subrogado que se usará en el proceso de división.
Valores posibles:
●
Mostrar solo - una observación con un valor faltante en la regla de división primaria no
se reproducirá en el árbol.
●
Usar subrogado: utilice esta opción para dividir sujetos faltantes en la variable
primaria. Si faltan todos los subrogados, la observación no se dividirá.
●
Detener si falta: si faltan todos los subrogados, el algoritmo enviará una observación
en la dirección de la mayoría.
Estilo del subrogado
Introduzca el estilo que controla la selección del mejor subrogado.
Valores posibles:
●
Usar clasificación correcta total: el algoritmo usa el número total de clasificaciones
correctas para encontrar una posible variable subrogada.
●
Usar porcentaje de casos no faltantes: el algoritmo usa el porcentaje de casos no
faltantes clasificados para encontrar un posible subrogado.
Subrogado máximo
Introduzca el número máximo de subrogados que se deben conservar en cada nodo de un
árbol.
Mostrar probabilidad
Seleccione la casilla de verificación Mostrar probabilidad para obtener la probabilidad de
los valores previstos durante el cálculo de un modelo de clasificación.
92
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
15.1.5
Red neural
15.1.5.1
Red neuronal MONMLP R
Sintaxis
Use este algoritmo para pronosticar, clasificar y reconocer los patrones estadísticos mediante las funciones de
la biblioteca R.
Nota
R no admite el almacenamiento PMML para la red neuronal MONMLP.
Propiedades de la red neuronal MONMLP R
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
●
Relleno: rellena los valores faltantes en la columna de destino.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino
Seleccione la columna de destino para la que desea realizar el análisis.
Neuronas de capa 1 oculta
Introduzca el número de nodos/neuronas de la primera capa oculta (hidden1). El valor
predeterminado es 5.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Función de transferencia de capa oculta
Seleccione la función de activación que se va a usar para la capa oculta (Th).
Función de transferencia de capa de salida
Seleccione la función de activación que se va a usar para la capa de salida (To).
Derivada de la función de transferencia de capa oculta
Seleccione la derivada de la función de activación de la capa oculta (Th.prime).
Derivada de la función de transferencia de capa de salida
Seleccione la derivada de la función de activación de la capa de salida (To.prime).
Neuronas de capa 2 oculta
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
93
Introduzca el número de nodos/neuronas de la segunda capa oculta (hidden2). El valor
predeterminado es 0.
Repeticiones máximas
Introduzca el número máximo de repeticiones para el algoritmo de optimización
(iter.max). El valor predeterminado es 5000.
Columnas monótonas
Introduzca los índices de columna a los que desea aplicar la limitación de tono único
(monotone).
Repeticiones de formación
Introduzca el número de repeticiones de formación tras las que se detendrá el cálculo de
la función de costes (iter.stopped).
Pesos iniciales
Introduzca un vector de peso inicial (init.weights).
Excepciones máximas
Introduzca el número máximo de excepciones para la rutina de optimización
(max.exceptions).
Escalar columna dependiente
Para escalar las columnas dependientes a la media cero y la varianza de unidad antes del
ajuste, seleccione Verdadero (scale.y).
Empaquetado necesario
Seleccione True para usar la agregación de arranque (bag).
Intentos para evitar mínimo local
Introduzca el número de intentos repetidos para evitar el mínimo local (n.trials).
Número de miembros del conjunto
Introduzca el número de miembros del conjunto para ajustar (n.ensemble).
15.1.5.2
Red neuronal NNet R
Sintaxis
Use este algoritmo para pronosticar, clasificar y reconocer los patrones estadísticos mediante las funciones de
la biblioteca R.
Propiedades de la red neuronal R-NNet
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
94
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
●
Tendencia: predice los valores para la columna dependiente y agrega una columna
adicional en la salida que contiene los valores previstos.
●
Relleno: rellena los valores faltantes en la columna de destino.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino
Seleccione la columna de destino para la que desea realizar el análisis.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Valores posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: El algoritmo conserva valores faltantes.
●
Detener: el algoritmo se detiene si falta un valor en la columna independiente o en la
columna dependiente.
Neuronas de capa oculta
Introduzca el número de neuronas/nodos en la capa oculta. El valor predeterminado es 5.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Tipo de algoritmo:
Seleccione el tipo de análisis que desee que ejecute el algoritmo.
Omitir capa oculta
Para agregar conexiones de capa de omisión desde la entrada a la salida (skip), seleccione
True.
Salida lineal
Para obtener una salida lineal (linout), seleccione True. Si selecciona el tipo de análisis de
Clasificación, este valor debe establecerse en True.
Usar Softmax
Seleccione True para usar los ajustes "modelos de registro lineal" y "probabilidad
condicional máxima" .
Las opciones salida lineal (linout), entropía, softmax y censurado se excluyen entre sí.
Usar entropía
Para usar el ajuste "probabilidad condicional máxima", seleccione True. De forma
predeterminada, el algoritmo usa el método de mínimos cuadrados.
Valores posibles:
●
True: use el ajuste "modelos de registro lineal"
●
False: use el método de mínimos cuadrados
Usar censurado
Para softmax, una fila de (0,1,1) indica un ejemplo de cada clase 2 y 3, pero para
censurado indica un ejemplo de cada clase 2 o 3.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
95
Rango
Introduzca el rango inicial de pesos aleatorios [-rang, rang]. Establezca este valor en 0,5 a
menos que la entrada sea grande. Si la entrada de datos es grande, elija el intervalo
mediante la fórmula: rang * max(|x|) <= 1
Caída de peso
Introduzca un valor para calcular pesos nuevos (caída de peso).
Repeticiones máximas
Introduzca el número máximo de repeticiones permitidas.
Matriz Hessian necesaria
Para devolver al indicador Hessian al mejor conjunto de pesos, seleccione True.
Pesos máximos
Introduzca el número máximo de pesos permitidos en el cálculo.
No hay ningún límite intrínseco en el código, pero incrementar el número máximo de
pesos puede resultar en un funcionamiento más lento y mayor consumo de tiempo.
Abstol
Introduzca el valor que indica el ajuste perfecto (abstol).
Reltol
El algoritmo finaliza si el optimizador no puede reducir los criterios de ajuste por un factor:
1 - reltol
Contrastes
Introduzca la lista de contrastes que se va a usar para factores que aparezcan como
variables en el modelo.
15.1.6
Agrupación en clúster
15.1.6.1
Medios K de HANA
Sintaxis
Use este algoritmo para almacenar en clúster las observaciones en grupos de observaciones relacionadas sin
conocimiento previo de dichas relaciones. El algoritmo agrupa en clúster las observaciones en grupos k, donde
k se proporciona como un parámetro de entrada. A continuación, el algoritmo asigna cada observación a los
clústeres según la proximidad de la observación al medio del clúster. El proceso continúa hasta que los
clústeres convergen.
Nota
96
●
Es posible que obtenga un número de clústeres distinto para cada clúster cada vez que ejecute el
algoritmo de medios K de HANA. Sin embargo, las observaciones de cada clúster siguen siendo las
mismas.
●
No se admite la creación de modelos mediante el algoritmo de medios K de HANA.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Propiedades de los medios K de HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo omite el registro que contiene los valores faltantes durante el
cálculo.
Número de clústeres
Introduzca el número de grupos para la agrupación en clúster. El valor predeterminado es
5.
Nombre de clúster
Introduzca un nombre para la columna recién creada que contiene el nombre del clúster.
Distancia
Introduzca el nombre de la columna recién creada que contiene la distancia de los
clústeres del nombre de centroids.
Repeticiones máximas
Introduzca el número de repeticiones permitidas para buscar clústeres. El valor
predeterminado es 100.
Método de cálculo central
Seleccione el método que se usará para calcular los centros del clúster inicial.
Medición de distancia
Introduzca el método para calcular la distancia entre el elemento y el centro del clúster.
Tipo de normalización
Seleccione el tipo de normalización.
Número de subprocesos
Introduzca el número de subprocesos que se pueden usar para la ejecución. El valor
predeterminado es 1.
Umbral de salida
Introduzca el valor de umbral para salir de las repeticiones. El valor predeterminado es
0,000000001.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
97
15.1.6.2
Medios R-K de HANA
Sintaxis
Use este algoritmo para almacenar en clúster las observaciones en grupos de observaciones relacionadas sin
conocimiento previo de dichas relaciones. El algoritmo agrupa en clúster las observaciones en grupos k, donde
k se proporciona como un parámetro de entrada. A continuación, el algoritmo asigna cada observación a los
clústeres según la proximidad de la observación al medio del clúster. El proceso continúa hasta que los
clústeres convergen.
Nota
●
Es posible que obtenga un número de clústeres distinto para cada clúster cada vez que ejecute el
algoritmo R-K-Means. Sin embargo, las observaciones de cada clúster siguen siendo las mismas.
●
No se admite la creación de modelos mediante el algoritmo de medios R-K de HANA.
Propiedades de medios R-K HANA
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Número de clústeres
Introduzca el número de grupos para la agrupación en clúster. El valor predeterminado es
5.
Nombre de clúster
Introduzca un nombre para la columna recién creada que contiene números de clúster.
Repeticiones máximas
Introduzca el número de repeticiones permitidas para buscar clústeres. El valor
predeterminado es 100.
Número de conjuntos Centroid iniciales
Introduzca el número de conjuntos iniciales centroid para la agrupación en clúster (inicio
n). El valor predeterminado es 1.
Tipo de algoritmo:
Seleccione el tipo de algoritmo que se usará para realizar la agrupación en clúster de
medios K.
98
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
15.1.6.3
R-K-Means
Sintaxis
Use este algoritmo para almacenar en clúster las observaciones en grupos de observaciones relacionadas sin
conocimiento previo de dichas relaciones. El algoritmo agrupa en clúster las observaciones en grupos k, donde
k se proporciona como un parámetro de entrada. A continuación, el algoritmo asigna cada observación a los
clústeres según la proximidad de la observación al medio del clúster. El proceso continúa hasta que los
clústeres convergen.
Nota
●
Es posible que obtenga un número de clústeres distinto para cada clúster cada vez que ejecute el
algoritmo R-K-Means. Sin embargo, las observaciones de cada clúster siguen siendo las mismas.
●
No se admite la creación de modelos mediante el algoritmo R-K-Means.
Propiedades de R-K-Means
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Número de clústeres
Introduzca el número de grupos para la agrupación en clúster.
Nombre de clúster
Introduzca un nombre para la columna recién creada que contiene el nombre del clúster.
Repeticiones máximas
Introduzca el número de repeticiones permitidas para buscar clústeres. El valor
predeterminado es 100.
Número de conjuntos Centroid iniciales
Introduzca el número de conjuntos iniciales de centroids para la agrupación en clúster
(inicio n). El valor predeterminado es 1.
Algoritmo
Seleccione el tipo de algoritmo que se usará para realizar la agrupación en clúster de
medios K.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
99
15.1.6.4
Mapas de organización propia de HANA
Sintaxis
Un mapa de organización propia (SOM) o un mapa de función de organización propia (SOFM) es un tipo de red
neuronal artificial formada con aprendizaje no supervisado para producir una representación discretizada de
bajas dimensiones (normalmente de dos dimensiones) del espacio de entrada de las muestras de formación,
denominado mapa. Estos mapas de organización propia se diferencian de otras redes neuronales en que
utilizan una función de vecindario para conservar las propiedades topológicas del espacio de entrada.
Por este motivo, los SOMs resultan útiles para las vistas de pocas dimensiones de datos de muchas
dimensiones, de forma similar a la escala multidimensional. El profesor finlandés Teuvo Kohonen fue el primero
en describir este modelo como una red neuronal artificial y en ocasiones se denomina mapa Kohonen. Al igual
que la mayoría de redes neuronales artificiales, los SOMs funcionan en dos modos: formación y creación de
mapas. La formación crea el mapa con ejemplos de entrada, un proceso competitivo que también se denomina
cuantificación de vectores. La creación de mapas clasifica automáticamente un nuevo vector de entrada.
El alcance de los SOM tiene diversas aplicaciones, como la virtualización, la agrupación en clúster de
documentos web y el reconocimiento por voz.
Propiedades de los mapas de organización propia de HANA
Altura del mapa
Introduzca una altura para el mapa. El valor predeterminado es 5.
Anchura del mapa
Introduzca una anchura para el mapa. El valor predeterminado es 5.
Alfa
Introduzca el valor para la tasa de aprendizaje. El valor predeterminado es 0,5.
Forma del mapa
Seleccione la forma para el mapa.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Nombre de clúster
Introduzca un nombre para la nueva columna que contiene los números de clúster para un
conjunto de datos determinado.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
100
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva el registro que contiene los valores faltantes durante
el cálculo.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Tipo de normalización
Seleccione el tipo de normalización.
Tipos posibles:
●
No es necesaria la normalización
●
Nueva normalización de rangos
●
Normalización del resultado cero:
Muestreo aleatorio
Introduzca el muestreo aleatorio que desee utilizar para realizar el cálculo. Si introduce -1,
el algoritmo selecciona por sí solo un número aleatorio para el cálculo. El valor
predeterminado es -1.
Repeticiones máximas
Introduzca la cantidad de repeticiones que desea que el algoritmo utilice para buscar
clústeres. El valor predeterminado es 100.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 2.
15.1.7
Asociación
15.1.7.1
Apriori de HANA
Sintaxis
Use este algoritmo para localizar patrones frecuentes de conjuntos de elementos en grandes conjuntos de
datos transaccionales para generar reglas de asociaciones. Este algoritmo sirve para averiguar qué productos
y servicios suelen comprar simultáneamente los clientes. Al analizar las tendencias de compra de los clientes
con los análisis de asociaciones, puede prever su comportamiento en un futuro.
Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que
compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un
mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines
[compatibilidad = 0,5, confianza= 0,1]
Nota
No se admite la creación de modelos mediante el algoritmo Apriori de HANA.
Propiedades de Apriori de HANA
Tipo a priori
Seleccione Apriori.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
101
Columna de elementos
Seleccione las columnas que contengan los elementos a los que desea aplicar el
algoritmo..
Columna de ID de transacción
Seleccione la columna que contenga los ID de transacción a los que desea aplicar el
algoritmo.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Valores posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los valores faltantes para su procesamiento.
Compatibilidad
Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es
0,1.
Confianza
Introduzca un valor para la confianza mínima de reglas/asociación. El valor
predeterminado es 0,8.
Recuento máximo de elementos
Introduzca la longitud de los elementos iniciales y de los elementos dependientes de la
salida. El valor predeterminado es 5.
Número de subprocesos
Escriba el número de hilos que el algoritmo debe ejecutar. El valor predeterminado es 1.
15.1.7.2
HANA Apriori Lite
Sintaxis
Use este algoritmo para buscar patrones frecuentes de conjuntos de elementos en conjuntos de datos
transaccionales grandes para generar reglas de asociación. Apriori Lite también admite el muestreo dentro del
algoritmo.
Nota
●
Puede usar HANA Apriori Lite desde las propiedades del algoritmo de HANA Apriori al seleccionar
AprioriLite como el Tipo Apriori.
●
No se admite la creación de modelos mediante el algoritmo AprioriLite de HANA.
●
Solo calcula dos conjuntos de elementos de gran tamaño.
102
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Propiedades de AprioriLite de HANA
Tipo a priori
Haga clic en AprioriLite.
Columna de elementos
Seleccione las columnas que contengan los elementos a los que desea aplicar el
algoritmo..
Columna de ID de transacción
Seleccione la columna que contenga los ID de transacción a los que desea aplicar el
algoritmo.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: el algoritmo conserva los valores faltantes para su procesamiento.
Compatibilidad
Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es
0,1.
Confianza
Introduzca un valor para la confianza mínima de reglas/asociación. El valor
predeterminado es 0,8.
Ejemplo obligatorio
Seleccione esta opción si desea ejemplificar los datos.
Ejemplificación de porcentaje
Introduzca el porcentaje de ejemplificación.
Recálculo obligatorio
Seleccione esta opción si desea recalcular el soporte y la confianza de cada iteración.
Número de subprocesos
Introduzca el número de subprocesos que se usarán para la ejecución.
15.1.7.3
HANA R Apriori
Sintaxis
Utilice este algoritmo para encontrar patrones en los conjuntos de elementos frecuentes en conjuntos de datos
grandes para generar reglas de asociación mediante el paquete de R "arules". Este algoritmo sirve para
averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Si se analizan las tendencias
de compra de los clientes con un análisis de asociación, se puede realizar una predicción de sus
comportamientos en el futuro.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
103
Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que
compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un
mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines
[compatibilidad = 0,5, confianza= 0,1]
Propiedades de HANA R Apriori
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Formato de entrada
Seleccione el formato de los datos de entrada.
Columnas de elementos
Seleccione las columnas que contengan los elementos a los que desea aplicar el
algoritmo..
Columna de ID de transacción
Seleccione la columna que contenga los ID de transacción a los que desea aplicar el
algoritmo.
Compatibilidad
Introduzca un valor para el soporte mínimo de un elemento.
Confianza
Introduzca un valor para la confianza mínima de reglas/asociación.
Reglas
Introduzca un nombre para la nueva columna que contiene las reglas a priori para un
conjunto de datos determinado.
Valores compatibles
Introduzca un nombre para la nueva columna que contiene la compatibilidad para las
reglas correspondientes.
Valores de confianza
Introduzca un nombre para la columna nueva que contiene los valores de confianza de las
reglas correspondientes.
Valores de elevación
Introduzca un nombre para la nueva columna que contiene los valores de elevación para
las reglas correspondientes.
ID de transacción
Introduzca un nombre para la nueva columna que contiene la ID de transacción.
Elementos
Introduzca un nombre para la nueva columna que contiene los nombres de los elementos.
Reglas coincidentes
Introduzca un nombre para la nueva columna que contiene las reglas coincidentes.
Elemento(s) Lhs
104
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a la
izquierda de las reglas o de los conjuntos de elementos.
Elemento(s) Rhs
Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a la
derecha de las reglas o de los conjuntos de elementos.
Ambos elementos
Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a
ambos lados de las reglas o de los conjuntos de elementos.
Ningún elemento(s)
Introduzca etiquetas separadas por comas que indiquen los elementos que no deben
aparecer en las reglas o en los conjuntos de elementos.
Apariencia predeterminada
Introduzca la apariencia predeterminada de los elementos que no se mencionen
específicamente.
Tipo de ordenación:
Seleccione la opción de ordenación para ordenar los elementos atendiendo a su
frecuencia.
Criterios de filtro
Introduzca un valor numérico que indique el modo de filtrar los elementos sin usar de las
transacciones. El valor predeterminado es 0,1.
Usar estructura de árbol
Para organizar transacciones según un árbol de prefijos, seleccione True.
Usar ordenación por montículos
Para usar la ordenación por montículos en lugar de la ordenación rápida para ordenar las
transacciones, seleccione True.
Optimizar memoria
Para minimizar el uso de memoria en lugar de maximizar la velocidad, seleccione True.
Cargar transacciones a la memoria
Para cargar las transacciones en la memoria, seleccione True.
15.1.7.4
Apriori R
Sintaxis
Utilice este algoritmo para encontrar patrones en los conjuntos de elementos frecuentes en conjuntos de datos
grandes para generar reglas de asociación mediante el paquete de R "arules". Este algoritmo sirve para
averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Si se analizan las tendencias
de compra de los clientes con un análisis de asociación, se puede realizar una predicción de sus
comportamientos en el futuro.
Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que
compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
105
mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines
[compatibilidad = 0,5, confianza= 0,1]
Propiedades de R-Apriori
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Formato de entrada
Seleccione el formato de los datos de entrada.
Columnas de elementos
Seleccione las columnas que contengan los elementos a los que desea aplicar el
algoritmo..
Columna de ID de transacción
Seleccione la columna que contenga los ID de transacción a los que desea aplicar el
algoritmo.
Compatibilidad
Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es
0,1.
Confianza
Introduzca un valor para la confianza mínima de reglas/asociación. El valor
predeterminado es 0,8.
Reglas
Introduzca un nombre para la nueva columna que contiene las reglas a priori para un
conjunto de datos determinado.
Valores compatibles
Introduzca un nombre para la nueva columna que contiene la compatibilidad para las
reglas correspondientes.
Valores de confianza
Introduzca un nombre para la columna nueva que contiene los valores de confianza de las
reglas correspondientes.
Valores de elevación
Introduzca un nombre para la nueva columna que contiene los valores de elevación para
las reglas correspondientes.
ID de transacción
Introduzca un nombre para la nueva columna que contiene la ID de transacción.
Elementos
Introduzca un nombre para la nueva columna que contiene los nombres de los elementos.
Reglas coincidentes
Introduzca un nombre para la nueva columna que contiene las reglas coincidentes.
Elemento(s) Lhs
106
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a la
izquierda de las reglas o de los conjuntos de elementos.
Elemento(s) Rhs
Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a la
derecha de las reglas o de los conjuntos de elementos.
Ambos elementos
Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a
ambos lados de las reglas o de los conjuntos de elementos.
Ningún elemento(s)
Introduzca etiquetas separadas por comas que indiquen los elementos que no deben
aparecer en las reglas o en los conjuntos de elementos.
Apariencia predeterminada
Introduzca la apariencia predeterminada de los elementos que no se mencionen
específicamente.
Tipo de ordenación:
Seleccione la opción de ordenación para ordenar los elementos por frecuencia.
Criterios de filtro
Introduzca un valor numérico que indique el modo de filtrar los elementos sin usar de las
transacciones. El valor predeterminado es 0,1.
Usar estructura de árbol
Para organizar transacciones según un árbol de prefijos, seleccione True.
Usar ordenación por montículos
Para usar la ordenación por montículos en lugar de la ordenación rápida para ordenar las
transacciones, seleccione True.
Optimizar memoria
Para minimizar el uso de memoria en lugar de maximizar la velocidad, seleccione True.
Cargar la transacción a la memoria
Para cargar las transacciones en la memoria, seleccione True.
15.1.8
Clasificación
15.1.8.1
KNN HANA
Sintaxis
Use este componente para clasificar objetos según los datos de ejemplo formados. En KNN, los objetos se
clasifican por la mayoría de votos de sus vecinos.
Nota
No se admite la creación de modelos mediante el algoritmo KNN de HANA.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
107
Propiedades de KNN de HANA
Características
Seleccione las columnas de entrada con las que desea realizar el análisis
Recuento de vecinos
Introduzca el número de vecinos a tener en cuenta para buscar distancias. El valor
predeterminado es 5.
Tipo de voto
Seleccione el tipo de voto para el cálculo de la cuenta de vecino.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
●
Omitir: El algoritmo omite los registros que contienen valores faltantes en las
características o variables meta.
●
Conservar: El algoritmo conserva los valores faltantes.
Nombre de esquema
Introduzca el nombre de esquema que contiene los datos formados.
Nombre de tabla
Introduzca el nombre de la tabla que contiene los datos formados.
Columnas independientes
Introduzca las columnas de entrada que desea tener en cuenta para formar los datos.
Columna dependiente
Introduzca las columnas de salida que desea tener en cuenta para formar los datos.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores de clasificación.
Número de subprocesos
Escriba el número de subprocesos que desea que el algoritmo ejecute. El valor
predeterminado es 1.
15.1.8.2
Análisis ABC de HANA
Sintaxis
Use este algoritmo para clasificar objetos (como clientes, empleados o productos) basándose en un indicador
específico (como volumen de negocios o beneficio). Sugiere que los inventarios de una organización no son del
mismo valor. Además, los inventarios pueden agruparse en tres categorías (A, B y C) según su importancia
estimada. Los elementos "A" son muy importantes para una ogranización. Los elementos "B" tienen una
importancia media, es decir, son menos importantes que los elementos "A" pero más que los "C". Los
elementos "C" son los de menor importancia.
Un ejemplo de clasificación ABC sería:
108
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
●
Elementos A: 20% de las cuentas de elementos para el 70% del valor de consumo anual de todos los
elementos.
●
Elementos B: 30% de las cuentas de elementos para el 25% del valor de consumo anual de todos los
elementos.
●
Elementos C: 50% de las cuentas de elementos para el 5% del valor de consumo anual de todos los
elementos.
Propiedades de Análisis ABC de HANA
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: El algoritmo omite los registros que contienen valores faltantes en las
características o variables meta.
●
Conservar: el algoritmo conserva el registro que contiene los valores faltantes durante
el cálculo.
Desglose de porcentaje de A
Introduzca el porcentaje de elementos que desee clasificar en el grupo A. El valor por
defecto es 40. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes
de los elementos de los grupos A, B y C sea igual a 100%.
Desglose de porcentaje de B
Introduzca el porcentaje de elementos que desee clasificar en el grupo B. El valor por
defecto es 30. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes
de los elementos de los grupos A, B y C sea igual a 100%.
Desglose de porcentaje de C
Introduzca el porcentaje de elementos que desee clasificar en el grupo C. El valor por
defecto es 30. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes
de los elementos de los grupos A, B y C sea igual a 100%.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 30.
Nombre de columna prevista
Introduzca un nombre para la columna recién añadida que contiene los valores previstos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
109
15.1.8.3
Análisis de puntuaciones ponderadas de HANA
Sintaxis
Una tabla de puntuaciones ponderadas es un método para evaluar alternativas cuando la importancia de los
criterios es diferente. En una tabla de puntuaciones ponderadas, cada alternativa recibe una puntuación para
cada criterio. Estas puntuaciones se ponderan por la importancia de cada criterio. Todas las puntuaciones
ponderadas de una alternativa se suman para calcular la puntuación ponderada total. La alternativa con la
puntuación total más alta sería la mejor alternativa.
Puede utilizar tablas de puntuaciones ponderadas para predecir el comportamiento futuro de los clientes. Cree
un modelo basado en datos históricos en la aplicación de minería de datos y aplique el modelo a los nuevos
datos para realizar la predicción. Esta predicción (el resultado del modelo), se denomina puntuación. Puede
crear una sola puntuación para sus clientes teniendo en cuenta diferentes dimensiones.
Una función definida por tablas de puntuaciones ponderadas es una combinación lineal de funciones de una
variable.
f(x1,…,xn) = w1× f 1(x1) + … + wn× f n(xn)
Análisis de puntuaciones ponderadas de HANA
Característica
Seleccione la columna de entrada con la que desea realizar el análisis.
Tipo
Seleccione el tipo "Discreta" si la columna tiene datos categóricos o "Continua" si los
datos son numéricos.
Pesos
Introduzca las ponderaciones para la columna seleccionada. El valor predeterminado es
0,0.
Clave y puntuación
Introduzca los valores para las claves y puntuaciones.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
●
Omitir: El algoritmo omite los registros que contienen valores faltantes en las
características o variables meta.
●
Conservar: El algoritmo conserva valores faltantes.
Número de subprocesos
Escriba el número de hilos que el algoritmo debe ejecutar. El valor predeterminado es 1.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores previstos.
110
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
15.1.8.4
HANA Naive Bayes
Sintaxis
Naive Bayes es un algoritmo de clasificación basado en el teorema de Bayes. Estima la probabilidad
condicional de clase asumiendo que los atributos son condicionalmente independientes uno de otro. A pesar
de su simplicidad, Naive Bayes funciona bastante bien en áreas como la colasificación de documentos y y
filtrado de spam, y solo requiere una pequeña cantidad de datos de formación para estimar los parámetros
necesarios para la clasificación.
Propiedades de HANA Naive Bayes
Modo de salida
Seleccione el modo en el que desea usar la salida de este algoritmo.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino
Seleccione la columna de destino para la que desea realizar el análisis.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Suavizado de Laplace
Introduzca la constante de suavizado para las observaciones de suavizado. La constante
de suavizado debe ser un valor doble superior a 0. Introduzca 0 para deshabilitar el
suavizado de Laplace.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
●
Omitir: El algoritmo omite los registros que contienen valores faltantes en las
características o variables meta.
●
Conservar: el algoritmo conserva los registros que contiene los valores faltantes
durante el cálculo.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El
valor predeterminado es 1.
15.2 Componentes de preparación de datos
Use los componentes de preparación de datos para preparar los datos para el análisis. Estos componentes son
opcionales.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
111
15.2.1
Fórmula
Sintaxis
Utilice este componente para aplicar funciones y operadores predefinidos en los datos. Todas las funciones y
expresiones, excepto las funciones de manipulación de datos, añaden una nueva columna con el resultado de
la fórmula.
Nota
Cuando se introduce una cadena literal que contiene comillas simples, cada comilla de la cadena literal debe
ir precedida con un carácter de barra inversa (\). Por ejemplo, si desea escribir la palabra "Customer's",
deberá escribir "Customer\'s".
Nota
Cuando se introduce un nombre de columna que contiene corchetes, cada corchete en el interior del
nombre de la columna debe ir precedido con un carácter de barra inversa (\). Por ejemplo, si desea escribir
[Cliente[Edad]], deberá escribir [Cliente\[Edad\]].
Propiedades de las fórmulas
Nombre de fórmula
Introduzca un nombre para la nueva columna creada mediante la aplicación de una
fórmula.
Expresión
Escriba la fórmula que desea aplicar. Por ejemplo, Promedio([Edad]).
Ejemplo
Calcula el promedio de edad de los empleados
Tabla de empleados:
ID del empleado Nombre del
empleado
Fecha de
nacimiento
Edad
Fecha de
incorporación
Fecha de
confirmación
1
Laura
11/11/1986
25
12/9/2005
27/11/2005
2
Desi
12/5/1981
30
24/6/2000
10/7/2000
3
Álex
30/5/1978
33
10/10/1998
24/12/1998
4
Juan
6/6/1979
32
2/12/1999
20/12/1999
Para calcular el promedio de edad de los empleados, realice los siguientes pasos:
1.
Arrastre el componente Fórmula al editor de análisis.
2.
En la vista Propiedades, introduzca un nombre para la fórmula.
Por ejemplo, Promedio_Edad.
112
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
3.
En el campo Expresión, introduzca la fórmula: PROMEDIO([Edad])
4.
Seleccione Validar para validar la sintaxis de la fórmula.
5.
Seleccione Fin.
Tabla de salida:
ID del
empleado
Nombre del
empleado
Fecha de
nacimiento
Edad
Fecha de
incorporació
n
Fecha de
Promedio_Ed
confirmación ad
1
Laura
11/11/1986
25
12/9/2005
27/11/2005
30
2
Desi
12/5/1981
30
24/6/2000
10/7/2000
30
3
Álex
30/5/1978
33
10/10/1998
24/12/1998
30
4
Juan
6/6/1979
32
2/12/1999
20/12/1999
30
Funciones admitidas
Categoría
Función (Función cuando se aplica Descripción
a la tabla Empleado)
Fecha
DÍASENTRE
Devuelve el número de días entre dos
fechas.
FECHAACTUAL
Devuelve la fecha actual del sistema.
MESESENTRE
Devuelve el número de meses entre dos
fechas.
Por ejemplo, la nueva columna contiene
2,0,2,0 cuando se aplica
MESESENTRE([Fecha de
incorporación],[Fecha de
confirmación]) a la tabla Empleado.
NOMBREDELDÍA
Devuelve el nombre del día en formato
de cadena.
Por ejemplo, la nueva columna
contendrá lunes, sábado, sábado,
jueves cuando se aplique
NOMBREDELDÍA([Fecha de
incorporación]) a la tabla Empleado.
NÚMERODEDÍADELMES
Devuelve el número del día de un mes
determinado.
Por ejemplo, la fecha 12/11/1980
devuelve el número 12.
NÚMERODEDÍADELASEMANA
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Devuelve el número de día de una
semana.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
113
Categoría
Función (Función cuando se aplica Descripción
a la tabla Empleado)
Por ejemplo, domingo=1, lunes=2.
NÚMERODEDÍADELAÑO
Devuelve el número de día de un año.
Por ejemplo, el 1 de enero=1, 1 de
febrero=32, 3 de febrero=34.
ÚLTIMODÍADELASEMANA
Devuelve la fecha del último día de la
semana.
Por ejemplo, la fecha 12/9/2005
devuelve 17/9/2005
ÚLTIMODÍADELMES
Devuelve la fecha del último día del mes.
Por ejemplo, la fecha 12/9/2005
devuelve 30/9/2005
NÚMERODEMESDELAÑO
Devuelve el número del mes en una
fecha.
Por ejemplo, enero=1, febrero=2,
marzo=3.
NÚMERODESEMANADELAÑO
Devuelve el número de semana en un
año.
Por ejemplo, 12/9/2005 devuelve 38.
NÚMERODETRIMESTREDELAFECHA
Devuelve el número del trimestre en una
fecha.
Por ejemplo, 12/9/2005 devuelve 3.
Cadena
CONCAT
Concatena dos cadenas.
Por ejemplo, la expresión
CONCAT('EE.UU.','Australia') devuelve
EE.UU.Australia.
ENLACADENA
Devuelve el resultado True si se
encuentra la cadena buscada en la
cadena fuente.
Por ejemplo, la expresión
ENLACADENA('EE.UU.','EU') devuelve
el resultado True.
SUBCADENA
Devuelve una subcadena de una cadena
fuente.
Por ejemplo, la expresión
SUBCADENA('EE.UU.',1,2) devuelve EE.
LONGCAD
114
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Devuelve el número de caracteres que
contiene la cadena fuente. Por ejemplo,
la expresión LONGCAD('Australia')
devuelve 9.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Categoría
Función (Función cuando se aplica Descripción
a la tabla Empleado)
Matemáticas
MAX
Devuelve el valor máximo de una
columna.
MIN
Devuelve el valor mínimo de una
columna.
CONTAR
Devuelve el número de valores de una
columna.
SUMA
Devuelve la suma de los valores de una
columna.
PROMEDIO
Devuelve el promedio de los valores de
una columna.
@REEMPLAZAR
Realiza un reemplazo in situ de una
cadena.
Manipulación de datos
Por ejemplo, @REEMPLAZAR([país],
'EE.UU.','NORTEAMÉRICA')
reemplazará la palabra EE.UU. por
NORTEAMÉRICA en la columna de país.
@ENBLANCO
Reemplaza los valores en blanco con un
valor específico.
Por ejemplo,
@ENBLANCO([país],'EE.UU.') sustituye
todos los valores en blanco por la
cadena EE.UU. en la columna de país.
@SELECT
Selecciona las filas que cumplen una
condición determinada. Puede utilizar
cualquier operador condicional para
especificar la condición.
Por ejemplo,
@SELECT([país]=='EE.UU.') selecciona
las filas en las que el país sea igual a
EE.UU.
Expresión condicional
IF(condición) THEN(expresión de
cadena/expresión matemática/
expresión condicional) ELSE(expresión
de cadena/expresión matemática/
expresión condicional)
Comprueba si se cumple la condición y
devuelve un valor si se cumple ("true") y
otro si no se cumple ("false").
Por ejemplo, IF([Fecha de
incorporación]>12/9/2005) THEN
('Empleado incorporado después del 12
de septiembre de 2005') ELSE
('Empleado incorporado el o antes del
12 de septiembre de 2005')
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
115
Nota
Las expresiones matemáticas que contienen funciones que devuelve un valor numérico no son compatibles.
Por ejemplo, la expresión NÚMERODEDÍADELMES(FECHAACTUAL())+2 no es compatible porque
NÚMERODEDÍADELMES devuelve un valor numérico.
Operadores matemáticos
Use operadores matemáticos para crear fórmulas para columnas numéricas y/o números. Por ejemplo, la
expresión[Edad] + 1 añade una nueva columna con los valores 26, 31, 34 y 33.
Operadores matemáticos
Descripción
+
Operador de adición
-
Operador de sustracción
*
Operador de multiplicación
/
Operador de división
()
Paréntesis
^
Operador de potencia
%
Operador de porcentaje
E
Operador exponencial
Operadores condicionales
Use los operadores condicionales para crear expresiones IF THEN ELSE o SELECT.
Operadores condicionales
Descripción
==
Igual a
!=
No igual a
<
Menor que
>
Mayor que
<=
Menor o igual a
>=
Mayor o igual a
Operadores lógicos
Use los operadores lógicos para comparar dos condiciones y obtener un resultado de "true" o "false". Por
ejemplo, IF([Fecha de incorporación]>12/9/2005 && [Edad] >=25 ) THEN ('True') ELSE ('False') añade una
nueva columna con los valores True, False, False, False.
116
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Operadores lógicos
Descripción
&&
Y
||
O
15.2.2 Muestra
Sintaxis
Utilice este componente para seleccionar un subconjunto de datos de conjuntos de datos mayores.
El componente Muestra es compatible con los siguientes tipos de muestra:
●
Primeros N: selecciona los primeros registros N del conjunto de datos.
●
Últimos N: selecciona los últimos registros N del conjunto de datos.
●
Cada N: Selecciona cada registro N del conjunto de datos, donde N es un intervalo. Por ejemplo, si N=2, se
seleccionarán los registros 2, 4, 6, 8, etc.
●
Aleatorización simple: selecciona registros aleatoriamente del tamaño N o un porcentaje de N de los
registros de un conjunto de datos.
●
Aleatorización sistemática: en este tipo de muestra, se crean intervalos simples o depósitos según el
tamaño del depósito. El componente Muestra selecciona un registro N aleatoriamente del primer depósito
y de cada depósito posterior.
Propiedades de muestra
Tipo de muestra
Seleccione el tipo de muestreo.
Limitar filas por
Seleccione el método para limitar las filas.
Número de filas
Introduzca el número de filas que desee seleccionar.
Porcentaje de filas
Introduzca el porcentaje de filas que desee seleccionar.
Tamaño del depósito
Introduzca el tamaño del depósito en el que desee seleccionar una fila aleatoria.
Tamaño de paso
Introduzca el intervalo entre las filas que desee seleccionar.
Filas máximas
Introduzca el número máximo de filas que desee seleccionar.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
117
Ejemplo
Seleccionar un subconjunto de datos de un conjunto de datos determinado
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
1
Laura
11/11/1986
25
2
Desi
12/5/1981
30
3
Álex
30/5/1978
33
4
Juan
6/6/1979
32
5
Tomás
4/7/1987
24
6
Tobías
30/6/1970
41
7
Anna
24/6/1965
46
8
Valeria
6/7/1990
21
9
María
19/9/1985
26
10
Martín
21/11/1986
25
Salida de muestras:
1.
2.
3.
4.
118
Primeros N: donde N=5
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
1
Laura
11/11/1986
25
2
Desi
12/5/1981
30
3
Álex
30/5/1978
33
4
Juan
6/6/1979
32
5
Tomás
4/7/1987
24
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
7
Anna
24/6/1965
46
8
Valeria
6/7/1990
21
9
María
19/9/1985
26
10
Martín
21/11/1986
25
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
3
Álex
30/5/1978
33
6
Tobías
30/6/1970
41
9
María
19/9/1985
26
Últimos N: donde N=4
Cada N: Intervalo=3
Aleatorización simple: para un número de filas=2
El resultado pueden ser dos filas cualesquiera.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
5.
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
7
Anna
24/6/1965
46
8
Valeria
6/7/1990
21
Aleatorización sistemática: tamaño del depósito=4
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
2
Desi
12/5/1981
30
6
Tobías
30/6/1970
41
10
Martín
21/11/1986
25
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
1
Laura
11/11/1986
25
5
Tomás
4/7/1987
24
9
María
19/9/1985
26
o
15.2.3 Definición del tipo de datos
Sintaxis
Use este componente para cambiar el nombre, el tipo de datos y el formato de fecha desde la columna de
origen. Definir los tipos de datos ayuda a preparar los datos para que sean adecuados para un futuro análisis.
Por ejemplo:
●
Si el nombre de la columna del origen de datos es "des", es posible que no sea claro durante el análisis.
Cambie el nombre de la columna a "Designation" en el análisis, de modo que los usuarios finales puedan
comprenderlo fácilmente.
●
Si la fecha está almacenada con el formato mmddaa (120201, sin separador de fecha), el sistema puede
considerarlo como un valor entero. Mediante el componente Definición de tipo de datos, puede cambiar el
formato de fecha a cualquier formato válido, como mm/dd/aaaa o dd/mm/aaaa, etc.
Para cambiar el nombre, el tipo de datos y el formato de fecha de la columna de origen, realice los siguientes
pasos:
1.
Agregue el componente de definición de tipo de datos al análisis.
2.
En el menú contextual de los componentes, seleccione Configurar propiedades.
3.
Para cambiar el nombre de la columna, introduzca un alias para la columna de origen necesaria.
4.
Para cambiar el tipo de datos de la columna, seleccione el tipo de datos necesario para la columna de
origen.
5.
Seleccione Fin.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
119
15.2.4 Filtro
Sintaxis
Utilice este componente para filtrar filas y columnas basándose en una condición específica.
Nota
El componente Filtro in-DB no es compatible con las funciones y las expresiones avanzadas.
Nota
Si modifica la fuente de datos después de configurar el componente de filtro, éste seguirá conservando los
filtros de fila definidos con anterioridad.
Propiedades de los filtros
Columnas seleccionadas
Seleccione las columnas para el análisis.
Condición del filtro
Introducir la condición del filtro.
Ejemplo
Filtrar la columna "Tienda" de los datos fuentes y aplicar la condición "Beneficio >2000".
Tienda
Ingresos
Beneficio
Hito
10000
1000
Ferrero
20000
4500
Soler
25000
8000
1.
Deseleccione la columna "Tienda" de las columnas seleccionadas.
2.
En el panel Filtro de fila, seleccione la columna Beneficio.
3.
En la opciónSeleccionar desde rango, introduzca 2000 en el cuadro de texto Desde. El cuadro de texto
Hastadebe quedar vacío.
4.
Seleccione Aceptar.
5.
Elija Guardar y cerrar.
6.
Ejecute el análisis.
Tabla de salida:
Ingresos
Beneficio
20000
4500
25000
8000
120
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Sintaxis
Nota
El componente de filtro solo es compatible con expresiones que devuelvan un resultado booleano.
Por ejemplo, en la tabla Empleado que aparece a continuación:
ID del empleado Nombre del
empleado
Fecha de
nacimiento
Edad
Fecha de
incorporación
Fecha de
confirmación
1
Laura
11/11/1986
25
12/9/2005
27/11/2005
2
Desi
12/5/1981
30
24/6/2000
10/7/2000
3
Álex
30/5/1978
33
10/10/1998
24/10/1998
4
Juan
6/6/1979
32
2/12/1999
20/12/1999
●
La expresión DÍASENTRE([Fecha de incorporación],[Fecha de confirmación]) no es una expresión de filtro
válida, ya que devuelve un valor numérico. El uso correcto de la expresión DÍASENTRE como filtro es
DÍASENTRE([Fecha de incorporación],[Fecha de confirmación]) == 14. Esta expresión selecciona aquellas
filas en las que el número de días entre la "fecha de incorporación" y la "fecha de confirmación" es 14. En la
tabla anterior, se seleccionaría la tercera fila.
●
En cambio, NOMBREDELDÍA([Fecha de incorporación]) == 'Sábado' selecciona la segunda y la tercera fila
de la tabla Empleado.
Nota
Cuando se introduce una cadena literal que contiene comillas simples, cada comilla de la cadena literal debe
ir precedida con un carácter de barra inversa (\). Por ejemplo, si desea escribir la palabra "Customer's",
deberá escribir "Customer\'s".
Nota
Cuando se introduce un nombre de columna que contiene corchetes, cada corchete en el interior del
nombre de la columna debe ir precedido con un carácter de barra inversa (\). Por ejemplo, si desea escribir
[Cliente[Edad]], deberá escribir [Cliente\[Edad\]].
Funciones admitidas
Nota
El componente de filtro no es compatible con las funciones de manipulación de datos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
121
Categoría
Función (Función cuando se aplica Descripción
a la tabla Empleado)
Fecha
DÍASENTRE
Devuelve el número de días entre dos
fechas.
FECHAACTUAL
Devuelve la fecha actual del sistema.
MESESENTRE
Devuelve el número de meses entre dos
fechas.
Por ejemplo, la nueva columna contiene
2,0,2,0 cuando se aplica
MESESENTRE([Fecha de
incorporación],[Fecha de
confirmación]) a la tabla Empleado.
NOMBREDELDÍA
Devuelve el nombre del día en formato
de cadena.
Por ejemplo, la nueva columna
contendrá lunes, sábado, sábado,
jueves cuando se aplique
NOMBREDELDÍA([Fecha de
incorporación]) a la tabla Empleado.
NÚMERODEDÍADELMES
Devuelve el número del día de un mes
determinado.
Por ejemplo, la fecha 12/11/1980
devuelve el número 12.
NÚMERODEDÍADELASEMANA
Devuelve el número de día de una
semana.
Por ejemplo, domingo=1, lunes=2.
NÚMERODEDÍADELAÑO
Devuelve el número de día de un año.
Por ejemplo, el 1 de enero=1, 1 de
febrero=32, 3 de febrero=34.
ÚLTIMODÍADELASEMANA
Devuelve la fecha del último día de la
semana.
Por ejemplo, la fecha 12/9/2005
devuelve 17/9/2005
ÚLTIMODÍADELMES
Devuelve la fecha del último día del mes.
Por ejemplo, la fecha 12/9/2005
devuelve 30/9/2005
NÚMERODEMESDELAÑO
Devuelve el número del mes en una
fecha.
Por ejemplo, enero=1, febrero=2,
marzo=3.
122
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Categoría
Función (Función cuando se aplica Descripción
a la tabla Empleado)
NÚMERODESEMANADELAÑO
Devuelve el número de semana en un
año.
Por ejemplo, 12/9/2005 devuelve 38.
NÚMERODETRIMESTREDELAFECHA
Devuelve el número del trimestre en una
fecha.
Por ejemplo, 12/9/2005 devuelve 3.
Cadena
CONCAT
Concatena dos cadenas.
Por ejemplo, la expresión
CONCAT('EE.UU.','Australia') devuelve
EE.UU.Australia.
ENLACADENA
Devuelve el resultado True si se
encuentra la cadena buscada en la
cadena fuente.
Por ejemplo, la expresión
ENLACADENA('EE.UU.','EU') devuelve
el resultado True.
SUBCADENA
Devuelve una subcadena de una cadena
fuente.
Por ejemplo, la expresión
SUBCADENA('EE.UU.',1,2) devuelve EE.
Matemáticas
Expresión condicional
MAX
Devuelve el valor máximo de una
columna.
MIN
Devuelve el valor mínimo de una
columna.
CONTAR
Devuelve el número de valores de una
columna.
SUMA
Devuelve la suma de los valores de una
columna.
PROMEDIO
Devuelve el promedio de los valores de
una columna.
IF(condición) THEN(expresión de
cadena/expresión matemática/
expresión condicional) ELSE(expresión
de cadena/expresión matemática/
expresión condicional)
Comprueba si se cumple la condición y
devuelve un valor si se cumple ("true") y
otro si no se cumple ("false").
Por ejemplo, IF([Fecha de
incorporación]>12/9/2005) THEN
('Empleado incorporado después del 12
de septiembre de 2005') ELSE
('Empleado incorporado el o antes del
12 de septiembre de 2005')
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
123
Nota
Las expresiones matemáticas que contienen funciones que devuelve un valor numérico no son compatibles.
Por ejemplo, la expresión NÚMERODEDÍADELMES(FECHAACTUAL())==2 no es compatible porque
NÚMERODEDÍADELMES devuelve un valor numérico.
Operadores matemáticos
Use operadores matemáticos para crear fórmulas para columnas numéricas y/o números. Por ejemplo, la
expresión[Edad] + 1añade una nueva columna con los valores 26,31,34 y 33.
Operadores matemáticos
Descripción
+
Operador de adición
-
Operador de sustracción
*
Operador de multiplicación
/
Operador de división
()
Paréntesis
^
Operador de potencia
%
Operador de porcentaje
E
Operador exponencial
Operadores condicionales
Use los operadores condicionales para crear expresiones IF THEN ELSE o SELECT.
Operadores condicionales
Descripción
==
Igual a
!=
No igual a
<
Menor que
>
Mayor que
<=
Menor o igual a
>=
Mayor o igual a
Operadores lógicos
Use los operadores lógicos para comparar dos condiciones y obtener un resultado de "true" o "false". Por
ejemplo, IF([Fecha de incorporación]>12/9/2005 && [Edad] >=25 ) THEN ('True') ELSE ('False') añade una
nueva columna con los valores True, False, False, False.
124
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Operadores lógicos
Descripción
&&
Y
||
O
15.2.5 Normalización
Sintaxis
Use este componente para normalizar los datos de atributo. Los atributos con un valor mayor tienden a tener
un peso mayor. La normalización intenta transformar los datos de un rango más grande a uno más pequeño,
por ejemplo, [0,1], [-1,1].
Nota
La normalización solo muestra las columnas con valores numéricos.
El componente de normalización admite los siguientes métodos de normalización:
●
Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza
cada uno de ellos para ajustarlo a un rango específico. Al efectuar la normalización mín./máx., puede
indicar un valor máximo nuevoy un valor mínimo nuevo.Esta normalización es útil para asegurar que los
valores extremos están limitados dentro de un rango fijo.
Nota
○
●
Nuevo valor máximo debe ser superior que el Nuevo valor mínimo.
Normalización del resultado Z: cálculo basado en el medio y la desviación estándar de cada atributo.
Esta normalización es útil para determinar si un valor específico está por encima o por debajo del
promedio, y por cuánto.
●
Normalización de escalado decimal: La coma decimal del valor de cada atributo se desplaza conforme a su
valor absoluto máximo.
Propiedades de normalización
Seleccionar una columna
Seleccione la columna que desee normalizar.
Tipo de normalización
Seleccione el tipo de normalización.
Nuevo máximo
Indique el valor del nuevo máximo. El valor predeterminado es 1.
Nuevo mínimo
Indique el valor del nuevo mínimo. El valor predeterminado es 0.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
125
Ejemplo
Normalizar el tiempo utilizado para cubrir una distancia en concreto.
Tabla:
Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
66
Desi
500
360
Álex
500
201
Juan
500
78
Tomás
500
504
Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes:
1.
En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos.
2.
Arrastre el componente Normalización al editor de análisis o haga doble clic en Normalización.
3.
Desde el menú contextual del componente de normalización, seleccione Configurar propiedades.
4.
Seleccione la columna que desea normalizar de la lista desplegable Seleccionar una columna.
Nota
Solo puede seleccionar las columnas con valores numéricos.
Por ejemplo, Tiempo (en segundos).
5.
Desde la lista desplegable Método de normalización, seleccione Mín-Máx.
6.
Indique los valores para el Nuevo máximo y el Nuevo mínimo. En este ejemplo, los valores son 0 y 1
respectivamente.
7.
Seleccione Finalizado y, a continuación, Ejecutar.
Tabla de salida:
Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
0.05
Desi
500
0.30
Álex
500
0.17
Juan
500
0.06
Tomás
500
0.42
Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado
decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del
resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni
de Nuevo mínimo.
Salida de la normalización del resultado Z:
Tabla de salida:
126
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
-0.49
Desi
500
1.77
Álex
500
0.55
Juan
500
-0.40
Tomás
500
2.88
Salida de la normalización del escalado decimal:
Tabla de salida:
Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
0.01
Desi
500
0.04
Álex
500
0.02
Juan
500
0.01
Tomás
500
0.05
15.2.6 Categorización de HANA
Sintaxis
La categorización, también conocida como discretización, suaviza un valor de datos ordenado. Divide el rango
de una variable numérica en conjuntos de subrangos, denominados almacenajes, y reemplaza cada valor por
su número de almacenaje. Realizar el almacenaje de datos antes de ejecutar determinados algoritmos, como el
algoritmo de árbol de decisiones, ayuda a reducir la complejidad del modelo.
Existen cuatro métodos de categorización:
●
Anchos iguales basados en el número de agrupamientos
●
Anchos iguales basados en el ancho del agrupamiento
●
Igual profundidad
●
Desviación del medio
Y tres métodos para el suavizado:
●
Suavizado por medios de agrupamiento: cada valor de un agrupamiento se reemplaza por un valor de
agrupamiento del medio.
●
Suavizado por medianas de almacenaje: cada valor de almacenaje se reemplaza por la mediana de
almacenaje.
●
Suavizado por límites de agrupamiento: los valores máximos y mínimos de un agrupamiento dado se
identifican como los límites de agrupamiento. A continuación, cada valor de agrupamiento se reemplaza
por el valor de límite más cercano.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
127
Propiedades de la categorización de HANA
Columna independiente
Seleccione la columna de origen de entrada en la que desea realizar la categorización.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Métodos posibles:
●
Omitir: el algoritmo omite los registros que contienen valores faltantes en las
columnas independientes o dependientes.
●
Conservar: conserva los valores que faltan.
Método de categorización
Seleccione el método de categorización.
Número de agrupamientos
Introduzca el número de agrupamientos necesarios.
Método de suavizado
Seleccione el método de suavizado.
Nombre de columna agrupada
Introduzca un nombre para la nueva columna que contiene números de agrupación.
Nombres de columna de valores suavizada
Introduzca el nombre de la columna nueva que contiene los valores suavizados.
Ejemplo
Realizar la categorización de datos en un conjunto de datos
Ciudad
Temperatura
Amsterdam
6
Fráncfort
12
Cantón
13
Ciudad de El Cabo
15
Waldorf
10
Bangalore
23
Bombay
24
Miami
30
Río de Janeiro
32
Sídney
25
Dubai
38
Para realizar el agrupamiento de la columna Temperatura por anchos iguales basado en el número de anchos y
aplicar métodos de suavizado por medios, lleve a cabo los siguientes pasos:
1.
128
Arrastre el componente Categorización de HANA al editor de análisis.
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
2.
Haga doble clic en Categorización de HANA o pase el cursor del ratón por encima de Categorización de
HANA y seleccione Configurar propiedades.
3.
En la lista desplegable Columna independiente, elija una columna.
Nota
Solo se pueden seleccionar las columnas que tengan valores en forma de dígito numérico.
Por ejemplo, Temperatura.
4.
En la lista desplegable Valores faltantes, seleccione Omitir.
5.
En Método de categorización, seleccione Anchos iguales basados en el número de agrupamientos.
6.
En el número de agrupamientos, introduzca 4.
7.
Seleccione Suavizado obligatorio.
8.
En los métodos de suavizado, seleccione Medio de agrupamiento.
9.
En Introducir nombre para la columna agregada recientemente, en Nombre de columna agrupada,
introduzca Agrupamiento de temperatura.
Nota
Puede dar un nombre a la columna según sus preferencias o requisitos de análisis. Esta columna
contiene el valor agrupado.
10. En Introducir nombre para la columna agregada recientemente, en Columna suavizada, introduzca
Suavizado de temperatura.
Nota
Puede dar un nombre a la columna según sus preferencias o requisitos de análisis. Esta columna
contiene el valor suavizado.
Tabla de salida:
Ciudad
Temperatura
Agrupamiento de
temperatura
Suavizado de
temperatura
Amsterdam
6
1
8.0
Fráncfort
12
2
13.33333
Cantón
13
2
13.33333
Ciudad de El Cabo
15
2
13.33333
Waldorf
10
1
8.0
Bangalore
23
3
25.5
Bombay
24
3
25.5
Miami
30
3
25.5
Río de Janeiro
32
4
35.0
Sídney
25
3
25.5
Dubai
38
4
35.0
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
129
15.2.7 Normalización de HANA
Sintaxis
Use este componente para normalizar los datos de atributo. La normalización de HANA escala los grandes
datos de atributo de valor para que entren en un rango específico, como -1.0 a 1.0, o 0.0 a 1.0. Puede usar este
componente para el análisis en base de datos. La normalización de datos es útil para los algoritmos de
clasificación que implican redes neurales, o medidas de distancia, como la clasificación y agrupamiento en
clúster de los vecinos más cercanos.
Nota
Si desea que los datos procesados reemplacen la columna existente, seleccione Reemplazar columna.
El componente de normalización admite los siguientes métodos de normalización:
●
Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza
cada uno de ellos para ajustarlo a un rango específico. Al realizar la normalización mínima-máxima puede
especificar el Nuevo valor máximo y el Nuevo valor mínimo. Esta normalización es útil para asegurar que los
valores extremos están limitados dentro de un rango fijo.
Nota
○
●
Nuevo valor máximo debe ser superior que Nuevo valor mínimo.
Normalización del resultado Z: cálculo basado en el medio y la desviación estándar de cada atributo.
Esta normalización es útil para determinar si un valor específico está por encima o por debajo del
promedio, y por cuánto.
●
Normalización de escalado decimal: La coma decimal de los valores de cada atributo se desplaza conforme
a su valor absoluto máximo.
Nota
Puede seleccionar Reemplazar columna, si desea que los datos normalizados reemplacen los datos de la
columna existentes, en los que se lleva a cabo la normalización.
Ejemplo
Normalizar el tiempo utilizado para cubrir una distancia en concreto.
Tabla:
Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
66
Desi
500
360
Álex
500
201
Juan
500
78
Tomás
500
504
Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes:
130
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
1.
En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos.
2.
Arrastre el componente Normalización de HANA al editor de análisis o haga doble clic en Normalización de
HANA.
3.
Haga doble clic en Normalización de HANA o pase el puntero del ratón por encima de Normalización de
HANA y seleccione Configurar propiedades.
4.
Seleccione las columnas que desee normalizar.
Nota
Solo puede seleccionar las columnas con valores numéricos.
Por ejemplo, Tiempo (en segundos).
5.
Desde la lista desplegable Tipo de normalización, seleccione Mín-Máx.
6.
Introduzca los valores para Nuevo máximo y Nuevo mínimo.
7.
Seleccione Finalizado y, a continuación, Ejecutar.
Tabla de salida:
Nombre
Distancia (en metros)
Tiempo (en segundos)
Tiempo (en
segundos)_Normalizado
Laura
500
66
0.05
Desi
500
360
0.30
Álex
500
201
0.17
Juan
500
78
0.06
Tomás
500
504
0.42
Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado
decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del
resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni
de Nuevo mínimo.
Salida de la normalización del resultado Z:
Tabla de salida:
Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
-0.49
Desi
500
1.77
Álex
500
0.55
Juan
500
-0.40
Tomás
500
2.88
Salida de la normalización del escalado decimal:
Tabla de salida:
Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
0.01
Desi
500
0.04
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
131
Nombre
Distancia (en metros)
Tiempo (en segundos)
Álex
500
0.02
Juan
500
0.01
Tomás
500
0.05
15.3 Grabadores de datos
Use los grabadores de datos para almacenar los resultados de los análisis en archivos planos o bases de datos
para su análisis posterior.
15.3.1
CSV Writer
Sintaxis
Use este componente para escribir datos en archivos planos como archivos CSV, TEXT y DAT.
Propiedades de CSV Writer
Nombre de archivo
Seleccione la ruta de archivos e introduzca el nombre del archivo .csv, .dat o .txt.
Sobrescribir si existe
Seleccione esta opción para sobrescribir un archivo existente.
Separador de columnas
Seleccione un delimitador de columnas que separe los tokens de datos del archivo.
Introducir carácter de comillas sencillas
Seleccione el carácter para reemplazar los separadores de columna mientras escribe los
datos.
Incluir encabezados de columna
Seleccione esta opción para usar la primera fila como encabezado de columna.
Codificación
Seleccione el método de codificación de texto para escribir los datos.
Separador de decimales
Seleccione el carácter para la representación decimal en la agrupación de dígitos.
Separador de agrupaciones
Seleccione el carácter para el separador de miles.
132
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
Formato de número
Introduzca el formato de número que desea aplicar a los datos numéricos.
Formato de fecha y hora
Seleccione el formato de fecha que desea aplicar a las fechas.
15.3.2 JDBC Writer
Sintaxis
Use este componente para escribir datos en bases de datos relacionales, como MySQL, MS SQL Server, DB2,
Oracle, SAP MaxDB y SAP HANA.
Propiedades de JDBC Writer
Tipo de base de datos
Seleccione el tipo de base de datos.
Ruta del controlador de base de datos
Introduzca la ubicación de la ruta del controlador JDBC. Por ejemplo, para escribir en la
base de datos de Oracle, debe especificar la ubicación del archivo jar JDBC de Oracle (C:
\ojdbc6.jar)
Nombre de base de datos de equipo
Introduzca el nombre del equipo en el que está instalada la base de datos.
Número de puerto
Introduzca el número de puerto de la base de datos o del servicio.
Nombre de base de datos
Introduzca el nombre de la base de datos.
Nombre de usuario
Introduzca el nombre de usuario de la base de datos.
Contraseña
Introduzca la contraseña para el usuario de la base de datos.
Tipo de tabla
Introduzca el tipo de tabla. Esta propiedad se aplica al escribir en la base de datos de SAP
HANA.
Nombre de tabla
Introduzca el nombre de la tabla.
Sobrescribir si existe
Seleccione esta opción para sobrescribir la tabla si ya existe.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
133
15.3.3 HANA Writer
Sintaxis
Use este componente para escribir datos en tablas de bases de datos SAP HANA.
Componente HANA Writer
Nombre de esquema
Seleccione un esquema.
Tipo de tabla
Seleccione el tipo de tabla para la tabla en la que desea escribir los datos.
Nombre de tabla
Indique un nombre para la tabla.
Sobrescribir si existe
Seleccione esta opción para sobrescribir la tabla si ya existe.
15.4 Modelos
Los modelos que cree guardando el estado de los algoritmos se muestran en forma de lista en la sección Modelos
de la lista Componentes. La aplicación SAP Predictive Analysis no contiene modelos predefinidos. Por lo tanto,
cuando se inicia la aplicación por primera vez, no se muestra la sección Modelos.
Para obtener información sobre la creación de un modelo nuevo, consulte la sección "Crear un modelo" en
Trabajar con modelos.
134
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Manual del usuario de SAP Predictive Analysis
Propiedades de los componentes
www.sap.com/contactsap
© 2014 SAP AG o una filial de SAP. Reservados todos los derechos.
Queda prohibida la reproducción o transmisión de cualquier parte
de esta publicación, en cualquier forma o para cualquier fin, sin el
permiso expreso de SAP AG. La información que aquí se incluye
puede modificarse sin previo aviso.
Algunos productos de software comercializados por SAP AG y sus
distribuidores contienen componentes de software con derechos de
autor de otros proveedores de software. Las especificaciones de
productos en cada país pueden ser diferentes.
Estos materiales los proporcionan SAP AG y sus empresas afiliadas
("SAP Group") con carácter informativo, sin declaración ni garantía
de ningún tipo y SAP Group no se hace responsable de los errores u
omisiones en dichos materiales. Las únicas garantías para los
productos y servicios de SAP Group son aquellas especificadas en
las cláusulas expresas de garantía que acompañan a dichos
productos y servicios, si las hubiera. Nada de lo que aparezca en
este documento debe interpretarse como garantía adicional.
SAP y otros productos y servicios de SAP mencionados, así como
sus respectivos logotipos, son marcas comerciales o marcas
registradas de SAP AG en Alemania y en otros países.
Consulte http://www.sap.com/corporate-en/legal/copyright/
index.epx para obtener información y avisos adicionales sobre
marcas comerciales.