SAP Predictive Analysis Document Version: 1.15 - 2014-02-03 Manual del usuario de SAP Predictive Analysis Tabla de contenidos 1 Recursos de documentación de SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5 2 Novedades de SAP Predictive Analysis 1.15. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3 Acerca de este manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 3.1 Ámbito de este manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.2 Audiencia de destino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 4 Información general de SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 5 Instalar SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 5.1 Requisitos previos de instalación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 5.2 Usar el programa de instalación de SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 5.2.1 5.3 Instalar SAP Predictive Analysis usando el programa de instalación. . . . . . . . . . . . . . . . . . . . . 9 Realizar una instalación sin supervisión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 5.3.1 Realizar una instalación sin supervisión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 5.4 Configurar registros de seguimiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 5.5 Para desinstalar SAP Predictive Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5.6 Consideraciones importantes para usar SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5.6.1 Para configurar _SYS_REPO para el usuario de SAP Predictive Analysis. . . . . . . . . . . . . . . . . 15 5.6.2 Indicadores OLAP admitidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 5.6.3 Obtener privilegios de esquema para acceder al origen de datos de HANA en línea. . . . . . . . . 15 5.6.4 Privilegios para ejecutar algoritmos PAL con la biblioteca de funciones de aplicación (AFL) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 5.7 Consideraciones importantes para usar universos de SAP BusinessObjects. . . . . . . . . . . . . . . . . . . . . 16 6 Instalación y configuración de R en código abierto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 6.1 Instalar R-3.0.1 y los paquetes necesarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 6.2 Configurar R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 6.3 Consideraciones importantes para el uso de SAP Predictive Analysis con algoritmos R en el modo online de SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 7 Introducción a SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 7.1 Conocimientos básicos de SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 7.2 Iniciar SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 7.3 Comprender SAP Predictive Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 7.3.1 Vista Diseñador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 7.3.2 Vista Resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 7.4 Usar SAP Predictive Analysis del principio al final. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 8 Crear análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 8.1 Crear un análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Tabla de contenidos 8.1.1 Adquirir datos de un origen de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 8.1.2 Preparar los datos para el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 8.1.3 Aplicar algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 8.1.4 Almacenar resultados del análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 8.2 Ejecutar el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 8.3 Guardar el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 8.4 Eliminación de análisis desde el documento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 8.5 Ver resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29 9 Adding Custom Component. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 9.1 Asistente de creación de componentes R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 9.2 Crear un componente R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 10 Analizar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 10.1 Gráficos de visualización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 10.1.1 Gráfico de matriz de dispersión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38 10.1.2 Gráfico de resumen estadístico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38 10.1.3 Coordenadas paralelas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 10.1.4 Árbol de decisiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 10.1.5 Gráfico de tendencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41 10.1.6 Gráfico de clúster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 10.1.7 Gráfico de nube de etiquetas a priori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 10.1.8 Matriz de confusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 11 Crear gráficos para visualizar los datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .45 12 Crear guiones para sus datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 13 Compartir gráficos y conjuntos de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 14 Trabajar con modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 14.1 Crear un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 14.2 Exportar un modelo como PMML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 14.3 Exportar un modelo a un archivo .spar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49 14.4 Exportar un modelo PAL de SAP HANA como procedimiento almacenado. . . . . . . . . . . . . . . . . . . . . . 49 14.4.1 Eliminar el procedimiento almacenado exportado de SAP HANA. . . . . . . . . . . . . . . . . . . . . . 50 14.5 Importar un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50 14.6 Eliminar un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 15 Propiedades de los componentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 15.1 Algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 15.1.1 Regresión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 15.1.2 Valores atípicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .69 15.1.3 Serie temporal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Manual del usuario de SAP Predictive Analysis Tabla de contenidos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 3 15.2 15.3 15.4 4 15.1.4 Árboles de decisiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 15.1.5 Red neural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 15.1.6 Agrupación en clúster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 15.1.7 Asociación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 15.1.8 Clasificación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Componentes de preparación de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 15.2.1 Fórmula. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 15.2.2 Muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 15.2.3 Definición del tipo de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 15.2.4 Filtro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .120 15.2.5 Normalización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 15.2.6 Categorización de HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .127 15.2.7 Normalización de HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 Grabadores de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 15.3.1 CSV Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 15.3.2 JDBC Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 15.3.3 HANA Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Tabla de contenidos 1 Recursos de documentación de SAP Predictive Analysis En la tabla siguiente se proporciona la lista de manuales disponibles para SAP Predictive Analysis: Tabla 1: ¿Qué es lo que se desea hacer? Entonces vaya aquí... Obtenga ayuda instantánea sobre cómo usar SAP Pre dictive Analysys o encuentre información sobre una función o un flujo de trabajo. La Ayuda en pantalla está disponible dentro de la apli cación del siguiente modo: ● Haga clic en el icono de ayuda (?) en un cuadro o ventana de diálogo. ● Seleccione Ayuda Ayuda . Obtenga documentación completa sobre cómo usar SAP Predictive Analysis (en inglés). Página de inicio de SAP Predictive Analysis Obtenga documentación completa sobre cómo usar SAP Predictive Analysis en un idioma distinto. Página Todos los productos de SAP Haga clic en un idioma, seleccione SAP Predictive Analysis y la versión de las listas desplegables. Obtenga la información más actualizada sobre el so Matriz de disponibilidad de productos SAP porte de base de datos y del software para SAP Predic tive Analysis. Manual del usuario de SAP Predictive Analysis Recursos de documentación de SAP Predictive Analysis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 5 2 Novedades de SAP Predictive Analysis 1.15 Las siguientes nuevas funciones están disponibles en esta versión de SAP Predictive Analysis: Novedades de esta versión Descripción Nuevo algoritmo PAL El algoritmo HANA Naive Bayes ahora está disponible en SAP Predictive Analysis para análisis. Cambio de terminología A partir de esta versión, los atributos se denominan Di mensiones. 6 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Novedades de SAP Predictive Analysis 1.15 3 Acerca de este manual 3.1 Ámbito de este manual Este manual ofrece: ● Información general de SAP Predictive Analysis ● Información sobre cómo instalar y configurar SAP Predictive Analysis ● Información acerca de los distintos algoritmos y componentes disponibles de SAP Predictive Analysis ● Información sobre cómo crear análisis y modelos ● Información sobre cómo analizar datos mediante técnicas de visualización predictiva Este manual no incluye: ● Cómo adquirir datos desde varios orígenes de datos ● Cómo realizar operaciones de manipulación de datos, limpieza de datos y operaciones de mejoras semánticas en la ficha Preparar ● Cómo crear cuadros de historias ● Cómo compartir gráficos y conjuntos de datos Nota SAP Predictive Analysis hereda la funcionalidad de adquisición de datos y de manipulación de datos de SAP Lumira. Por lo tanto, para obtener información acerca de los flujos de trabajo que no se tratan en este manual, consulte el Manual de usuario de SAP Lumira disponible en: http://help.sap.com/lumira. Se recomienda leer el Manual de usuario de SAP Lumira junto con el Manual de usuarios de SAP Predictive Analysis para comprender el flujo de trabajo completo para analizar datos mediante los algoritmos de análisis predictivo. 3.2 Audiencia de destino Esta guía está destinada a analistas profesionales de datos, usuarios empresariales, estadísticos y científicos de datos que desean usar la aplicación SAP Predictive Analysis para analizar y visualizar datos usando algoritmos predictivos. Nota Para usar la aplicación SAP Predictive Analysis debe familiarizarse con los algoritmos estadísticos y de minería de datos y tener un conocimiento básico acerca del uso de estos algoritmos. Manual del usuario de SAP Predictive Analysis Acerca de este manual © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 7 4 Información general de SAP Predictive Analysis SAP Predictive Analysis es una solución de análisis estadístico y minería de datos que permite elaborar modelos predictivos para descubrir perspectivas y relaciones ocultas en los datos, desde los que puede realizar predicciones sobre eventos futuros. Con SAP Predictive Analysis, puede realizar varios análisis en los datos, incluida la previsión de series de tiempo, la detección de valores atípicos, el análisis de tendencias, el análisis de clasificación, el análisis de segmentación y el análisis de afinidad. Esta aplicación permite analizar datos mediante distintas técnicas de visualización, como gráficos de matriz de dispersión, coordenadas paralelas, gráficos de clúster y árboles de decisiones. SAP Predictive Analysis ofrece una gama de algoritmos de análisis predictivo, admite el uso del idioma de análisis estadístico de origen abierto R y ofrece capacidades de minería de datos en la memoria para gestionar de forma eficaz análisis de datos de gran volumen. Nota SAP Predictive Analysis hereda la funcionalidad de adquisición de datos y de manipulación de datos de SAP Lumira. SAP Lumira es una herramienta de manipulación y visualización de datos. Con SAP Lumira, puede conectarse a varios orígenes de datos, como archivos sin procesar, bases de datos relacionales, bases de datos en memoria y universos de SAP BusinessObjects, y puede trabajar en distintos volúmenes de datos, desde una pequeña matriz de datos de un archivo CSV hasta un conjunto de datos muy grande de SAP HANA, puede seleccionar y limpiar los datos, y manipular los datos. 8 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Información general de SAP Predictive Analysis 5 Instalar SAP Predictive Analysis 5.1 Requisitos previos de instalación Antes de instalar SAP Predictive Analysis, asegúrese de que se cumplen los siguientes requisitos: ● En el equipo debe estar instalado el sistema operativo Microsoft Windows 7 o Microsoft Windows 8 R2. SAP Predictive Analysis se puede usar tanto en equipos de 32 bits como de 64 bits. ● Si ya ha instalado SAP Lumira en el equipo, deberá desinstalarlo antes de instalar SAP Predictive Analysis. ● Debe tener derechos de administrador para desinstalar SAP Predictive Analysis del equipo. ● Debe haber disponible suficiente espacio en disco en los siguientes recursos: Recurso Espacio necesario Unidad donde se encuentra la carpeta Datos de programa del usuario 2,5 GB Carpeta temporal del usuario (\AppData\Local 322 MB \Temp) Unidad donde se encuentra el directorio de instalación ● 1 GB Deben estar disponibles los siguientes puertos: Puerto Necesario para Cualquier puerto del intervalo 4520-4539 Instalación de SAP Predictive Analysis Para obtener una lista detalladas de los entornos admitidos y los requisitos de hardware, consulte la Product Availability Matrix en: http://service.sap.com/pam 5.2 Usar el programa de instalación de SAP Predictive Analysis El programa de instalación de SAP Predictive Analysis se encuentra en el archivo autoextraíble (SAPPredictiveAnalysisSetup.exe). El programa es un asistente de instalación que le guía en el proceso de instalación de los recursos necesarios de SAP Predictive Analysis en su equipo. El programa reconoce automáticamente el sistema operativo del equipo y comprueba los requisitos de la plataforma. Actualiza los archivos según sea necesario. 5.2.1 Instalar SAP Predictive Analysis usando el programa de instalación 1. Desplácese al archivo autoextraíble de SAP Predictive Analysis ( SAPPredictiveAnalysisSetup.exe ) y haga doble clic. Manual del usuario de SAP Predictive Analysis Instalar SAP Predictive Analysis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 9 Se muestra el cuadro de diálogo "Control de cuentas de usuario" con un mensaje de advertencia. 2. Elija Sí en la petición de confirmación. El programa de instalación de SAP Predictive Analysis se extraerá desde el archivo. El gestor de instalación comprueba si se cumplen todos los requisitos para la instalación. Si la comprobación de algún requisito resulta insatisfactoria, se abre una página Requisitos previos. Cierre el asistente y corrija los requisitos previos que no se cumplan antes de volver a ejecutar SAPPredictiveAnalysisSetup.exe. Si se confirman todos los requisitos previos para la instalación, se abre la página Definir propiedades. 3. Seleccione el idioma de instalación de la lista desplegable. 4. Especifique la carpeta de destino para instalar SAP Predictive Analysis. ○ Para aceptar el directorio de instalación predeterminado, elija Siguiente. ○ Para instalarSAP Predictive Analysis en una ubicación diferente, elija Examinar. Seleccione la carpeta que desee y elija Siguiente. Aparece la página Acuerdo de licencia. 5. Revise el acuerdo de licencia y seleccione Acepto el contrato de licencia y elija Siguiente. Aparecerá la página Registro. 6. Elija uno de los tipos de registro siguientes y, a continuación, rellene la información solicitada: Tabla 2: Seleccione un tipo de registro Indique esta información Descripción Usuario nuevo de SAP Lurima Cloud Indique la información necesaria para crear una cuenta nueva SAP Lumira Cloud. Si se registra como un usuario SAP Lumira Cloud, se publicarán los documentos en la nube. Usuario existente de SAP Lurima Cloud Indique su correo electrónico para su cuenta de SAP Lumira Cloude xistente. Código clave Introduzca su código clave. Registrar más tarde. Se instala la versión de SAP Pre dictive Analysis que se corres ponde con su clave de licencia. Puede elegir la versión con la que prefiere trabajar más tarde con la versión de prueba. 7. Seleccione Siguiente. Aparecerá la página Listo para instalación. Si es preciso, podrá volver atrás para modificar la información de instalación. 8. Para comenzar la instalación, elija Siguiente. La instalación ha finalizado cuando se abre la página Finalizar instalación. 9. Para iniciar automáticamente el programa, seleccione Iniciar SAP Predictive Analysis al finalizar la instalación. 10. Para salir de esta instalación, elija Finalizar. 10 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Instalar SAP Predictive Analysis 5.3 Realizar una instalación sin supervisión Al usar una instalación sin supervisión, los administradores del sistema pueden ejecutar una secuencia de comandos desde la línea de comandos para instalar automáticamente SAP Predictive Analysis en cualquier equipo de su sistema sin que el programa de instalación les solicite información ni muestre la barra de progreso. La instalación sin supervisión está principalmente orientada a los usuarios con funciones de administración de red. Una instalación silenciosa es especialmente útil cuando es necesario realizar varias instalaciones en una red empresarial. Después de crear el archivo de respuesta de la instalación sin supervisión, puede agregar el comando de instalación sin supervisión a sus secuencias de comandos de instalación. 5.3.1 Realizar una instalación sin supervisión Puede usar el extractor automático de SAP Predictive Analysis para crear un archivo de respuesta necesario para realizar una instalación sin supervisión. Siga estas instrucciones para crear un archivo de respuesta y realizar una instalación sin supervisión. 1. Haga clic en Inicio Ejecutar y escriba cmd para abrir una ventana del símbolo del sistema. 2. Desplácese al archivo autoextraíble de SAP Predictive Analysis: SAPPredictiveAnalysisSetup.exe 3. Ejecute el siguiente comando: SAPPredictiveAnalysisSetup.exe -w <<response_filepath>>\response.ini Nota <<ruta_archivo_respuesta>> representa la ruta de archivo donde quiere guardar el archivo de respuesta . Se abre el programa de instalación de SAP Predictive Analysis. 4. Siga el asistente de instalación para seleccionar las opciones de instalación de SAP Predictive Analysis. 5. En la página Iniciar la instalación, haga clic en Siguiente. El programa de instalación escribe las opciones de instalación en el archivo response.ini y se cierra. Consejo Puede abrir response.ini en un editor de texto para revisar las opciones de la instalación. 6. Para ejecutar la instalación sin supervisión, abra una ventana de Símbolo del sistema e introduzca el siguiente comando: SAPPredictiveAnalysisSetup.exe -s -r <<response_filepath>>\response.ini El parámetro -r requiere el nombre y la ubicación del archivo de respuesta tal como se especifica en el paso 3. El parámetro opcional -s oculta la barra de progreso de la extracción automática durante la instalación sin supervisión. Manual del usuario de SAP Predictive Analysis Instalar SAP Predictive Analysis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 11 5.4 Configurar registros de seguimiento Este procedimiento se usa para permitir que la aplicación SAP Predictive Analysis registre información sobre la ejecución de la aplicación. Esta información de registro ayuda a identificar los puntos conflictivos cuando la aplicación falla o detecta un problema. De forma predeterminada, los mensajes de error y los mensajes de seguimiento se escriben en la carpeta %TEMP% \sapvi\logs del equipo. Sin embargo, puede cambiar la ubicación predeterminada de la carpeta en la que se escribe la información de instalación al realizar los siguientes pasos: 1. Cree una carpeta en una ubicación para generar registros. Nota Asegúrese de que dispone de permiso de "escritura" en la carpeta. Por ejemplo, C:\logs. 2. Cree el archivo BO_Trace.ini y agregue los siguientes detalles de seguimiento. active=false; severity='E'; importance=xs; size=1000000; keep_num=437; alert=true; En la siguiente tabla se enumeran los parámetros generales para configurar el seguimiento de servidor. Parámetro Valores posibles Descripción active false, true Si se configura en true, se realizará el seguimiento de los mensajes de seguimiento que cumplan con el umbral configurado en el parámetro importance. Si se configura en false, no se realizará el seguimiento de los mensajes de seguimiento basados en su nivel de "importancia". El valor predeterminado es false. importance '<<', '<=', '==', '>=', '>>', xs, s, m, l, xl Especifica el umbral para los mensajes de seguimiento. Se realizará el Nota importance = xs o importance = << son las opciones más detalladas seguimiento de todos los mensajes que estén más allá de este umbral. El valor predeterminado es m (medio). disponibles mientras que importance = xl o importance = >> son las menos detalladas. 12 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Instalar SAP Predictive Analysis Parámetro Valores posibles Descripción alert false, true Si se configura en true, se realizará el seguimiento de los mensajes de seguimiento que cumplan con el umbral configurado en el parámetro severity. Si se configura en false, no se realizará el seguimiento de los mensajes de seguimiento basados en su nivel de "gravedad". El valor predeterminado es true. severity ' ', 'W', 'E', 'A', correcto, advertencia, error, aserción Especifica la gravedad de umbral a partir de la que se puede realizar el seguimiento de los mensajes. El valor predeterminado es 'E'. size Los valores posibles son enteros >= 1000 Especifica el número de mensajes de un archivo de registro de seguimiento antes de que se cree otro nuevo. El valor predeterminado es 100000. keep_num administrator Los valores posibles son enteros >= 1000 Especifica el número de registros para Cadenas o enteros Especifica una notación que se conservar. utilizará en el archivo de registro. Por ejemplo, si administrator = "hello" esta cadena se inserta en el archivo de registro. log_dir Por ejemplo, C:\logs. Especifica el directorio de archivos de registro de salida. De forma predeterminada, los archivos de registro se almacenan en la carpeta Logging. always_close on, off Especifica si el archivo de registro se debe cerrar después de que se escriba un seguimiento en el archivo de registro. El valor predeterminado es off. 3. Guarde y cierre el archivo BO_trace.ini. 4. Coloque el archivo BO_Trace.ini en C:\logs. 5. Configure las siguientes variables de entorno: ○ BO_TRACE_LOGDIR = C:/logs ○ BO_TRACE_CONFIGDIR = C:/logs Manual del usuario de SAP Predictive Analysis Instalar SAP Predictive Analysis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 13 ○ 6. BO_TRACE_CONFIGFILE = C:/logs/BO_Trace.ini Reinicie la aplicación. Los registros de aplicación se generan en la ubicación especificada. Por ejemplo, C:\logs. 5.5 Para desinstalar SAP Predictive Analysis 1. Elija 2. Elija Desinstalar un programa. 3. Haga clic con el botón derecho en SAP Predictive Analysis y elija Desinstalar. Se muestra el asistente de instalación de SAP Predictive Analysis. 4. En la página Confirmar desinstalación, elija Siguiente. 5. Para completar la desinstalación, elija Finalizar. 5.6 Inicio Panel de control Programas . Consideraciones importantes para usar SAP HANA Esta sección contiene las consideraciones y requisitos importantes para usar SAP Predictive Analysis con la base de datos de SAP HANA. Requisitos de seguridad para publicar en SAP HANA Antes de que los usuarios puedan publicar contenido en SAP HANA, se les deben asignar privilegios y funciones. Estas funciones y privilegios también son necesarios para recuperar datos de SAP HANA. Use la aplicación SAP HANA Studio para signar funciones y privilegios a los usuarios. Para obtener información acerca de la administración de la base de datos de SAP HANA y el uso de SAP HANA Studio, consulte Base de datos de SAP HANA: Manual de administración. Para obtener información acerca de la seguridad de usuario, consulte el Manual de seguridad de SAP HANA (incluida Seguridad de base de datos de SAP HANA). Se le debe asignar a la cuenta de usuario que se use para iniciar sesión en el sistema de SAP HANA desde SAP Predictive Analysis la función MODELING (en SAP HANA). Nota Esta acción solo la puede realizar un usuario con los privilegios ROLE_ADMIN en la base de datos de SAP HANA. Cuando un usuario de SAP Predictive Analysis inicia sesión en el sistema de SAP HANA, la cuenta _SYS_REPO interna debe: ● Disponer de los privilegios SQL SELECT. ● Tener la opción Se puede conceder a otros seleccionada en el esquema del usuario (SAP Predictive Analysis). 14 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Instalar SAP Predictive Analysis 5.6.1 Para configurar _SYS_REPO para el usuario de SAP Predictive Analysis Si ya hay una cuenta de un usuario de SAP Predictive Analysis definida en el sistema SAP HANA: 1. Desde la conexión del sistema en la ventana Navegador de SAP HANA Studio, seleccione Catálogo > Autorización > Usuarios. 2. Haga doble clic en la cuenta _SYS_REPO. 3. En la ficha Privilegios de SQL, haga clic en el icono + , introduzca el nombre del esquema del usuario y pulse Aceptar. 4. Elija SELECT y el Sí correspondiente en Se puede conceder a otros. 5. Elija Implementar o Guardar. Nota Los usuarios también pueden abrir un editor de SQL en SAP HANA Studio y ejecutar la siguiente instrucción SQL: GRANT SELECT ON SCHEMA <user_account_name> TO _SYS_REPO WITH GRANT OPTION 5.6.2 Indicadores OLAP admitidos SAP HANA admite solo los siguientes indicadores de agregación en orígenes de datos OLAP ● SUMA ● MIN ● MAX ● CONTAR Si su conjunto de datos contiene una agregación basada en un indicador que no se encuentra en la lista superior, SAP HANA ignorará la agregación durante la publicación y esta no formará parte del resultado final publicado. 5.6.3 Obtener privilegios de esquema para acceder al origen de datos de HANA en línea Los privilegios de esquema (_SYS_REPO , _SYS_BI , _SYS_BIC ) los proporciona el administrador de SAP HANA. Si una cuenta para un usuario de SAP Predictive Analysis ya está definida en el sistema de SAP HANA, el administrador de SAP HANA debe realizar los siguientes pasos para conceder los privilegios de esquema al usuario de SAP Predictive Analysis: 1. Desde la conexión del sistema de la ventana Navegador SAP HANA Studio, seleccione Seguridad > Usuarios. 2. Haga doble clic en la <cuenta de usuario de HANA en línea>. 3. En la ficha Privilegios SQL, haga clic en el icono + , seleccione _SYS_REPO y Aceptar. Manual del usuario de SAP Predictive Analysis Instalar SAP Predictive Analysis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 15 4. En Privilegios para '_SYS_REPO', seleccione SELECT. Lleve a cabo los mismos pasos para el esquema _SYS_BI y el esquema _SYS_BIC. 5.6.4 Privilegios para ejecutar algoritmos PAL con la biblioteca de funciones de aplicación (AFL) Si ya se ha definido una cuenta en el sistema de SAP HANA para el usuario de SAP Predictive Analysis, el administrador de SAP HANA debe realizar los siguientes pasos: 1. Desde la conexión del sistema de la ventana Navegador SAP HANA Studio, seleccione Seguridad > Usuarios. 2. Haga doble clic en la <cuenta de usuario de HANA en línea>. 3. En la ficha Privilegios SQL, haga clic en el icono + , seleccione AFL_WRAPPER_GENERATOR(SYSTEM) y Aceptar. 4. En Privilegios para 'AFL_WRAPPER_GENERATOR(SYSTEM)', seleccione EXECUTE. 5. En la ficha Funciones concedidas, haga clic en el icono + , seleccione AFL__SYS_AFL_AFLPAL_EXECUTE y Aceptar. Para obtener más información sobre cómo instalar la AFL y crear el procedimiento AFL_WRAPPER_GENERATOR(SYSTEM), consulte el Manual de referencia de la Biblioteca de Predictive Analysis (PAL) de SAP HANA 5.7 Consideraciones importantes para usar universos de SAP BusinessObjects Para adquirir datos de universos que existen en la plataforma de BI 4.0, asegúrese de que el servidor de Web Intelligence está en funcionamiento. Para obtener una lista completa de plataformas de BI compatibles, consulte SAP Products Availability Matrix 16 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Instalar SAP Predictive Analysis 6 Instalación y configuración de R en código abierto R es un idioma de programación de código abierto y un entorno de software para estadística informática. 6.1 Instalar R-3.0.1 y los paquetes necesarios Para usar algoritmos R de código abierto en sus análisis, debe instalar el entorno R y configurarlo con la aplicación SAP Predictive Analysis. SAP Predictive Analysis ofrece una opción que permite instalar y configurar R 3.0.1 y los paquetes necesarios desde la aplicación. Asegúrese de que está conectado a Internet cuando instale R. Antes de instalar R-3.0.1 de la aplicación, asegúrese de que se cumplen los requisitos siguientes: ● El R existente está desinstalado y las entradas de registro y la carpeta de instalación de R se han eliminado de la máquina. ● Las variables del entorno de R (R_LIBS, R_HOME) y las variables de la ruta de R se han eliminado. Para instalar el entorno R y los paquetes necesarios, realice los siguientes pasos: 1. Inicie la aplicación SAP Predictive Analysis. 2. En el menú Archivo, elija Instalar y configurar R. 3. Seleccione Instalar R. 4. Lea el acuerdo de licencia de R de código abierto, las instrucciones importantes y seleccione Acepto instalar R usando la secuencia de comandos. 5. Seleccione Aceptar. Nota Si ya ha instalado R 3.0.1, puede usar este procedimiento para instalar los paquetes de R que desee. Nota R 2.11.1 no es compatible desde la versión SAP Predictive Analysis 1.14 en adelante. 6.2 Configurar R Después de instalar R, debe configurar el entorno R para habilitar los algoritmos R en la aplicación. Si ya ha instalado R-2.15.x o R-3.0.x y los paquetes necesarios, puede omitir el paso de instalación de R y configurar R directamente. Para configurar R, realice los siguientes pasos: Manual del usuario de SAP Predictive Analysis Instalación y configuración de R en código abierto © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 17 1. Inicie la aplicación SAP Predictive Analysis. 2. En el menú Archivo, elija Instalar y configurar R. 3. En la ficha Configuración, seleccione Habilitar algoritmos R de Open Source. 4. Seleccione Examinar para seleccionar la carpeta de instalación de R. Por ejemplo, C:\Users\Public\R-3.0.1. 5. Seleccione Aceptar. Se muestra el cuadro de diálogo "Control de cuentas de usuario" con un mensaje de advertencia. 6. Elija Sí en la petición de confirmación. 6.3 Consideraciones importantes para el uso de SAP Predictive Analysis con algoritmos R en el modo online de SAP HANA SAP HANA admite la minería de datos In-DB mediante la integración R y la biblioteca de Predictive Analysis (PAL). Al usar SAP Predictive Analysis con algoritmos de integración R en una base de datos de SAP HANA, tenga en cuenta las siguientes consideraciones importantes: ● Para usar algoritmos R en la base de datos de SAP HANA, debe instalar y configurar R en SAP HANA. Para obtener información sobre cómo instalar y configurar R en SAP HANA, consulte el manual de integración R de SAP HANA disponible en http://help.sap.com/hana/hana_dev_r_emb_en.pdf. ● Asegúrese de que se ha concedido el privilegio de usuario Crear script R. ● Asegúrese de que están instalados los siguientes paquetes antes de ejecutar los algoritmos R en SAP HANA. ○ RODBC ○ RJDBC ○ DBI ○ monmlp ○ AMORE ○ XML ○ PMML (pmml_1.2.32) Nota Si instala una versión anterior de PMML que pmml_1.2.32, no aparecerá la visualización de gráficos. 18 ○ arules ○ caret ○ reshape ○ plyr ○ foreach ○ iterator © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Instalación y configuración de R en código abierto 7 Introducción a SAP Predictive Analysis 7.1 Conocimientos básicos de SAP Predictive Analysis Componente Un componente es la unidad de proceso básica de SAP Predictive Analysis. Cada componente contiene uno y/o varios puntos de conexión de salida. Estos puntos de conexión sirven para conectar componentes mediante conectores. Cuando se conectan componentes entre sí, los datos se transmiten de los componentes predecesores a sus componentes sucesores. SAP Predictive Analysis consta de los componentes siguientes: ● Preprocesadores ● Algoritmos ● Grabadores de datos Puede obtener acceso a los componentes desde la vista Diseñador del panel Predecir. Una vez que haya agregado componentes al editor de análisis, el icono de estado de los componentes permite identificar sus estados. Los estados de un componente pueden ser: ● Sin icono de estado: este estado se muestra cuando se arrastra un componente al editor de análisis. Indica que el componente tiene que configurarse antes de ejecutar el análisis. ● (Configurado): este estado se muestra cuando se han configurado para el componente todas las propiedades necesarias. ● ● (Correcto): este estado se muestra tras la ejecución correcta del análisis. (Error): este estado se muestra si la ejecución del análisis no finaliza correctamente debido al componente. Análisis Un análisis es una serie de componentes diferentes conectados entre sí en un orden determinado con conectores, que definen la dirección del flujo de datos. Manual del usuario de SAP Predictive Analysis Introducción a SAP Predictive Analysis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 19 Modelo Un modelo es un componente reutilizable creado para enseñar a un algoritmo a usar datos históricos. Modo de trabajo en base de datos (In-DB) En base de datos (In-DB) es un modo de ejecución de análisis en el que el proceso de datos se realiza en la base de datos de SAP HANA usando las capacidades de minería de datos. En este modo, los datos nunca se extraen de la base de datos para su proceso y, por ello, la velocidad de proceso es muy elevada. Este modo se puede usar para procesar conjuntos de datos grandes. SAP HANA admite la minería de datos In-DB mediante la integración R y la biblioteca de Predictive Analysis (PAL). Modo de trabajo en proceso (In-proc) En proceso (In-Proc) es un modo de ejecución de análisis en el que el proceso de los datos se realiza extrayendo los datos de la base de datos en un espacio de proceso de análisis predictivo. En este modo no puede utilizar los algoritmos PAL de SAP HANA para el análisis. No obstante, puede trabajar con algoritmos R y SAP. Este tipo de análisis también es conocido como análisis Out-DB. 7.2 Iniciar SAP Predictive Analysis Para iniciar SAP Predictive Analysis, elija Predictive Analysis 7.3 Inicio Todos los programas SAP Business Intelligence SAP SAP Predictive Analysis . Comprender SAP Predictive Analysis Al iniciar SAP Predictive Analysis, aparece la página de inicio. La página de inicio contiene información que le ayuda a comenzar con SAP Predictive Analysis. También dispone de la carpeta Ejemplos, que contiene dos documentos de ejemplo de SAP Predictive Analysis: Análisis de satisfacción de cliente y Análisis de previsión de ingresos. También puede ver los documentos de ejemplo de SAP Predictive Analysisen SAP Lumirautilizando la clave de licencia de prueba de SAP Predictive Analysis. Para comenzar con el análisis de datos utilizando SAP Predictive Analysis, necesita completar las siguientes tareas: ● 20 Conéctese al origen de datos y adquiera los datos para el análisis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Introducción a SAP Predictive Analysis ● Preparar los datos para el análisis mediante la aplicación de funciones de manipulación de datos y de limpieza de datos ● Analizar datos mediante la aplicación de algoritmos de minería de datos y de análisis estadísticos ● Compartir conjuntos de datos y gráficos con colaboradores externos Nota En este manual se describe cómo analizar datos mediante la aplicación de algoritmos de minería de datos y de análisis estadísticos. Para obtener información sobre cómo adquirir datos, preparar datos y compartir conjuntos de datos, consulte el Manual de usuario de SAP Lumira que está disponible en http://help.sap.com/ lumira. Una vez que se hayan adquirido datos del origen de datos, debe cambiar a la ficha Predecir para analizar los datos. 7.3.1 Vista Diseñador La vista Diseñador le permite diseñar y ejecutar análisis y crear modelos predictivos. Manual del usuario de SAP Predictive Analysis Introducción a SAP Predictive Analysis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 21 7.3.2 Vista Resultados La vista Resultados le permite comprender los datos y los resultados de análisis mediante diferentes técnicas de visualización y gráficos intuitivos. 7.4 Usar SAP Predictive Analysis del principio al final A continuación, se facilita información general del proceso que puede seguir para crear un gráfico basado en un conjunto de datos. El proceso no es lineal y puede ir de un paso a uno anterior para ajustar el gráfico o los datos. Pasos para trabajar con los da Descripción tos Conéctese al origen de datos. Nota Para obtener información so bre cómo conectarse al ori gen de datos, consulte la sec ción Conectarse al origen de datos del Manual de usuario de SAP Lumira. 22 Si el origen de datos es: ● RDBMS: introduzca las credenciales, conéctese al servidor de base de da tos, examine y seleccione el origen de datos; por ejemplo, si se está co nectando a SAP HANA, seleccione una vista y un cubo para crear el grá fico. ● Archivo plano: elija las columnas que desea adquirir, reducir o mostrar y ocultar. ● Universo: introduzca las credenciales de universo, conéctese al reposito rio del Servidor de administración central y seleccione un universo para crear el gráfico. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Introducción a SAP Predictive Analysis Pasos para trabajar con los da Descripción tos Vea y organice las columnas y las dimensiones. Nota Para obtener información so bre cómo ver columnas y di mensiones, consulte la sec ción Preparar los datos del Manual de usuario de SAP Lu mira. Analice los datos usando algo ritmos de análisis predictivo. Nota En este manual, se propor ciona información sobre cómo analizar los datos usando los algoritmos de análisis predictivo. Puede ver los datos adquiridos como columnas o restricciones. Puede organi zar los datos mostrados para facilitar la creación de gráficos realizando estas acciones del modo siguiente: ● Crear filtros y ocultar las columnas no necesarias ● Crear indicadores, jerarquías temporales y geográficas ● Limpiar y organizar los datos en columnas usando un rango de herra mientas de manipulación ● Crear columnas con fórmulas usando una amplia selección de funciones disponibles Cuando disponga de los datos pertinentes en la ficha Preparar, cambie a la fi cha Predecir y cree un análisis para descubrir patrones en los datos y predecir los resultados futuros. En la ficha Predecir, puede hacer lo siguiente: ● Crear un análisis ● Crear modelos predictivos ● Ver resultados de análisis ● Ver visualizaciones de modelos ● Crear gráficos Nota Para obtener información acerca de la creación de gráficos, consulte la sección Visualizar los datos del Manual de usuario de SAP Lumira. Guardar el análisis Manual del usuario de SAP Predictive Analysis Introducción a SAP Predictive Analysis Dar nombre y guardar el análisis que incluye los gráficos. Los análisis se guar dan en un documento con el formato de archivo .lums en la carpeta de la apli cación en Documentos en la ruta del perfil. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 23 8 Crear análisis 8.1 Crear un análisis Puede usar SAP Predictive Analysis para realizar minería y análisis estadísticos de datos mediante la ejecución de los datos con una serie de componentes. Los componentes de la serie están conectados entre sí con conectores, lo que define la dirección del flujo de datos. Este proceso recibe el nombre de análisis. Un documento es el punto de inicio al usar SAP Predictive Analysis. Debe crear un documento para empezar a analizar los datos y crear nuevos análisis. Puede abrir documentos guardados que están almacenados localmente para ver o modificar análisis y conjuntos de datos existentes. Cada documento es un archivo que contiene: ● Parámetros de conexión para el origen de datos, si el origen es un RDBMS. ● Conjunto de datos: los datos de la columna usada para crear gráficos. ● Análisis y modelos y sus resultados. ● Los gráficos se crean a partir de los datos y se guardan como visualizaciones. Para crear un análisis, realice los siguientes pasos: 1. Adquiera datos de un origen de datos 2. (Opcional) Prepare los datos para el análisis (por ejemplo, filtrando los datos) 3. Aplique algoritmos 4. (Opcional) Almacene los resultados de los análisis para realizar análisis posteriores Para agregar múltiples análisis al documento, seleccione el botón Añadir análisisde la barra de herramientas de análisis. Enlaces relacionados Adquirir datos de un origen de datos [página 24] Preparar los datos para el análisis [página 25] Aplicar algoritmos [página 26] Almacenar resultados del análisis [página 28] 8.1.1 Adquirir datos de un origen de datos 1. En la página de inicio, seleccione Archivo 2. Conéctese o desplácese al origen de datos. Nuevo . Puede adquirir datos de los orígenes de datos siguientes: 24 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Crear análisis 3. Origen de datos Descripción Microsoft Excel Puede adquirir datos de una hoja de cálculo Micro soft Excel y realizar un análisis en proceso (in-proc) usando algoritmos SAP y R. CSV Puede adquirir datos de un archivo de datos de valo res separados por comas y realizar un análisis en proceso (in-proc) usando algoritmos SAP y R. Conectarse a SAP HANA Puede adquirir datos de las tablas, vistas y vista de análisis de SAP HANA y realizar un análisis en base de datos (in-db) con algoritmos PAL de SAP HANA. En este modo, los datos nunca se extraen de la base de datos para su proceso y, por ello, la velocidad de proceso es muy elevada. Este modo se puede usar para procesar conjuntos de datos grandes. Descargar desde SAP HANA Puede adquirir datos de las tablas, vistas y vista de análisis de SAP HANA y realizar un análisis en pro ceso (in-proc) usando algoritmos SAP y R. En ese modo, los algoritmos PAL de SAP HANA no están disponibles para el análisis. Descargar de un universo Puede adquirir datos de universos de SAP Busines sObjects presentes en las plataformas XI 3.x y BI 4.x y realizar un análisis en proceso (in-proc) usando al goritmos SAP y R. Consulta con SQL Puede crear un proveedor de datos propio introdu ciendo manualmente el SQL para un origen de datos de destino y realizar un análisis en proceso (in-proc) usando algoritmos SAP y R. Elija Crear. Ahora puede empezar a crear el análisis. En la ficha Predecir, se agrega el componente del origen de datos configurado al editor de análisis. Puede ejecutar el análisis para ver los resultados del componente del origen de datos. Nota Para obtener información sobre cómo conectarse a un origen de datos específico, consulte el Manual de usuario de SAP Lumira disponible en http://help.sap.com/lumira. 8.1.2 Preparar los datos para el análisis Este paso es opcional. Es posible que, en muchos casos, los datos sin procesar del origen de datos no sean adecuados para el análisis. Para obtener resultados precisos, es posible que tenga que preparar y procesar los datos antes del análisis. Puede encontrar las funciones de manipulación de datos en la pestaña Preparar y las funciones de preparación de Manual del usuario de SAP Predictive Analysis Crear análisis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 25 datos en la pestaña Predecir. En la pestaña Preparar, puede trabajar con los datos estáticos o sin procesar que se importen en SAP Predictive Analysis. En la ficha Predecir, puede trabajar con datos transitorios mediante componentes de preprocesadores. La preparación de datos implica la comprobación de los datos para la precisión y los campos faltantes, el filtrado de datos según valores de rango, el muestreo de datos para investigar un subconjunto de datos y la manipulación de datos. Puede procesar los datos mediante componentes de preparación de datos. 1. En la ficha Predecir, haga doble clic en el componente de preprocesador necesario de la lista Componentes. El componente de preprocesador se agrega al editor de análisis y se crea una conexión automática al componente de fuente de datos. 2. Desde el menú contextual del componente de preprocesador, seleccione Configurar propiedades. 3. En el cuadro de diálogo de propiedades de componente, introduzca los detalles necesarios para las propiedades del componente de preprocesador. 4. Seleccione Fin. 5. Para ver los resultados del análisis, seleccione Ejecutar. Enlaces relacionados Componentes de preparación de datos [página 111] Adding Custom Component [página 30] 8.1.3 Aplicar algoritmos Cuando disponga de los datos pertinentes para el análisis, tendrá que aplicar los algoritmos adecuados para descubrir los patrones de los datos. Saber qué algoritmo se tiene que usar en cada caso no es evidente. Puede usar una combinación de algoritmos para analizar los datos. Por ejemplo, primero puede usar algoritmos de series temporales para suavizar los datos y después usar algoritmos de regresión para averiguar las tendencias. En la tabla siguiente, se proporciona información sobre qué algoritmos elegir en determinados casos: Realizar predicciones basadas en tiempo Predicción de variables continuas basadas en otras variables del conjunto de datos 26 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Algoritmos de series temporales ● Suavizado exponencial sencillo ● Suavizado exponencial doble ● Suavizado exponencial triple Algoritmos de regresión ● Regresión lineal ● Regresión exponencial ● Regresión geométrica ● Regresión algorítmica Manual del usuario de SAP Predictive Analysis Crear análisis Localizar patrones frecuentes de conjuntos de elementos en grandes conjuntos de datos transaccionales para generar reglas de asociaciones Agrupar observaciones en grupos de conjuntos de datos similares Clasificar y predecir una o más variables discretas sobre la base de otras variables del conjunto de datos Detectar valores atípicos del conjunto de datos Predicción, clasificación y reconocimiento de patrón estadístico ● Regresión lineal múltiple ● Regresión polinómica ● Regresión logística Algoritmos de asociación ● Apriori ● AprioriLite Algoritmos de agrupación en clúster ● K-Means Árboles de decisiones ● HANA C 4.5 ● Árbol CNR R ● CHAID Algoritmos de detección de valores atípicos ● Rango intercuartil ● Valor atípico de vecino más próximo ● Detección de anomalías ● Prueba de varianza Algoritmos de red neuronal ● Red neuronal NNet R ● Red neuronal MONMLP R Si no encontró un algoritmo relevante, puede crear su propio componente personalizado con el script de R en SAP Predictive Analysis y realizar en el análisis en los datos que haya adquirido. Para obtener más información sobre cómo añadir un componente adicional, consulte: Adding Custom Component [página 30] 1. En la ficha Predecir, haga doble clic en el componente de algoritmo necesario de la lista Componentes. El componente de algoritmo se agrega al editor de análisis y se conecta al componente anterior del análisis. 2. Desde el menú contextual del componente de logaritmos, seleccione Configurar propiedades. 3. En el cuadro de diálogo de propiedades de componente, introduzca los detalles necesarios para las propiedades del componente de algoritmo. 4. Seleccione Fin. 5. Para ver los resultados del análisis, seleccione Ejecutar. Enlaces relacionados Algoritmos [página 52] Manual del usuario de SAP Predictive Analysis Crear análisis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 27 8.1.4 Almacenar resultados del análisis Este paso es opcional. Puede almacenar los resultados del análisis en archivos planos o en bases de datos para analizarlos posteriormente usando componentes grabadores de datos. Solo se almacena la vista de tabla en el componente grabador de datos. 1. En la ficha Predecir, haga doble clic en el componente grabador de datos necesario de la lista Componentes. El componente grabador de datos se agrega al editor de análisis y se conecta al componente anterior del análisis. 2. Desde el menú contextual del componente grabador de datos, seleccione Configurar propiedades. 3. En el cuadro de diálogo de propiedades del componente, introduzca los detalles necesarios para las propiedades del componente grabador de datos. 4. Seleccione Fin. 5. Para ver los resultados del análisis, seleccione Ejecutar. Enlaces relacionados Grabadores de datos [página 132] 8.2 Ejecutar el análisis Para ejecutar el análisis, seleccione Ejecutar en la barra de herramientas del editor de análisis. Si su análisis es muy grande y complejo, puede ejecutar el análisis componente por componente y analizar los datos. Para ejecutar una parte del análisis, seleccione Ejecutar hasta aquídesde el menú contextual del componente hasta el que quiere realizar la ejecución. 8.3 Guardar el análisis Después de crear un análisis, puede guardarlo para volverlo a usar en el futuro. En SAP Predictive Analysis, debe guardar el documento para guardar el análisis que cree. El documento guardado contiene el conjunto de datos, los análisis, resultados y visualizaciones. El documento se guarda con el formato de archivo .lums Para guardar un análisis en un documento, realice los siguientes pasos: 1. Seleccione 2. Introduzca un nombre para el documento. 3. Seleccione Guardar. 28 Archivo Guardar . © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Crear análisis Si crea varios análisis con el mismo conjunto de datos, todos los análisis se guardan en el mismo documento. Puede acceder a todos los análisis de un documento mediante la lista desplegable Análisis. 8.4 Eliminación de análisis desde el documento Para eliminar un análisis existente del documento, pase el puntero del ratón sobre la imagen del análisis de la barra de análisis y seleccione 8.5 Ver resultados Para ver los resultados de componentes en un análisis, una vez ejecutado, cambie a la vista Resultados o, en el menú contextual del componente, seleccione Ver resultados. Manual del usuario de SAP Predictive Analysis Crear análisis © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 29 9 Adding Custom Component As a statistician or a data scientist, you can create and add your component using R scripts in SAP Predictive Analysis. The newly added component is classified under Custom R Componentsin the Components list, depending on the type of component created. For example, it can be classified as an algorithm, a preprocessor component or a data writer. You can use custom components in SAP Predictive Analysispara ejecutar el análisis del conjunto de datos adquirido. 9.1 Asistente de creación de componentes R Sintaxis R es un idioma de programación de software y un entorno para el cálculo estadístico y los gráficos. SAP Predictive Analysis le proporciona un entorno para utilizar scripts R (dentro de un formato de función R válido) y crear un componente, que puede utilizarse para su análisis del mismo modo que para otro componente existente. Durante la creación de un componente R, puede proporcionar un nombre para el componente que aparece en la clasificación Componentes R personalizados de la lista Componente. Propiedades del asistente de creación de componentes R Nombre de componente Introduzca un nombre para el componente. Nota No puede cambiar el nombre del componente personalizado existente. Tipo de componente Seleccione el tipo de componente. Descripción de los componentes Indique una descripción del componente. Ésta aparecerá como información en pantalla del componente creado. Cargar script R Haga clic para cargar la secuencia de comandos. Editor de secuencia de comandos Copie y pegue o escriba el script R en la caja de texto. Nombre de la función principal Seleccione el nombre de la función que desee ejecutar. Marco de datos de entrada Seleccione el Marco de datos de entrada de la lista de parámetros. 30 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Adding Custom Component Marco de datos de salida Indique un nombre para la variable que desee utilizar como Marco de datos de salida. Nombre de la variable de modelo Indique un nombre para la variable que desee utilizar como variable de modelo. Mostrar visualización Mostrar resumen Seleccione esta opción para visualizar el resumen del algoritmo tras la ejecución del componente personalizado. Opción para guardar el modelo Seleccione esta opción para incluir la opción Guardar como modelo para el componente personalizado. Nota Si selecciona Opción para guardar el modelo, se habilita la caja Nombre de variable de modelo y aparece detalles de la función de puntaje modelo Opción para exportar como PMML Seleccione esta casilla de verificación para incluir la opción Exportar como PMML para el componente personalizado. Nota Solo se habilita la Opción de exportar como PMMLsi selecciona la Opción para guardar el modelo. Nombre de la función Definición de puntaje de modelo Seleccione el nombre de la función de puntaje modelo que desee ejecutar. Marco de datos de entrada Seleccione el Marco de datos de entrada de la lista de parámetros. Marco de datos de salida Indique un nombre para la variable que desee utilizar como Marco de datos de salida. Nombre de la variable de modelo de entrada Seleccione el Nombre de variable modelo de entrada de la lista de parámetros. Tener en cuenta todas las columnas del componente anterior Seleccione incluir la columna prevista del componente principal en la salida del componente personalizado. No tener en cuenta ninguno Seleccione excluir la columna prevista del componente principal en la salida del componente personalizado. Tipo de datos Seleccione el tipo de datospara la columna prevista del componente personalizado. Nuevo nombre de columna prevista Introduzca un nombre para la columna prevista. Ésta es la columna de salida del componente personalizado. Manual del usuario de SAP Predictive Analysis Adding Custom Component © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 31 Parámetros de función Nombre completo de la propiedad Indique el nombre de la Columna independientey de la Columna dependiente que aparecerá en la vista de propiedades del componente personalizado. Tipo de control Seleccione el Tipo de controlde la Columna independientey de la Columna dependiente. Tener en cuenta todas las columnas del componente anterior Seleccione incluir la columna prevista del componente principal en la salida del puntaje de modelo. No tener en cuenta ninguno Seleccione excluir la columna prevista del componente principal en la salida del puntaje de modelo. Tipo de datos Seleccione el Tipo de datospara la columna prevista del puntaje modelo. Nuevo nombre de columna prevista Introduzca un nombre para la columna prevista. Ésta es la columna de salida del puntaje modelo. Nombre de visualización de la propiedad Introduzca el nombre de la columna que aparece en la vista de propiedades del modelo guardado. Enlaces relacionados Crear un componente R [página 32] 9.2 Crear un componente R Antes de crear un componente R, debe asegurarse de que cumple los siguientes requisitos: ● La secuencia de comandos R está escrita en un formato de función R válido. ● La secuencia de comandos R se ejecuta en la consola de GUI de R. ● La secuencia de comandos R al menos tiene una función principal. ● Los paquetes necesarios para ejecutar la secuencia de comandos R deben estar instalados en su máquina o en el servidor de SAP HANA. ● La secuencia de comandos R escrito para el análisis en la base de datos devuelve un marco de datos. Debe tener en cuenta los siguientes procedimientos recomendados al escribir la secuencia de comandos R: ● La secuencia de comandos R escrito para el análisis en proceso devuelve un marco de datos. ● Se recomienda la conversión de tipo, por ejemplo, si una columna tiene valores numéricos, indíquela como as.numeric(output) 32 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Adding Custom Component ● Para variables de categoría utilizadas en la secuencia de comandos R, especifique la variable con el comando as.factor. A continuación se ofrece un ejemplo sobre cómo añadir un componente R personalizado en la lista Componentes para realizar un análisis de base de datos en un conjunto de datos numérico: 1. En la pestaña Predecir, en la lista Componentes seleccione Aparece un asistente Crear nuevo componente R personalizado. 2. En la ficha General, realice los siguientes subpasos: Componente R . a) En el cuadro de texto Nombre de componente, escriba Mi componente. b) En la lista desplegable Tipo de componente, seleccione Algoritmo. c) En el cuadro de texto Descripción de componente, escriba Componente R para regresión lineal sencilla. 3. Seleccione Siguiente. Aparecerá la página Comando. 4. En la página Comando, seleccione Cargar comando para seleccionar un archivo. Nota Escriba o copie y peque el siguiente comando R en el cuadro de texto. Nota Consulte los comentarios en la siguiente función R para poder entender y escribir su propio comando R. #This is a sample script for a simple linear regression component. #The script should be written in a valid R function format. #Function name and variable name in R script can be user-defined, which are supported in R. #The following is the argument description for the primary function SLR: #InputDataFrame - Dataframe in R that contains the output of the parent component. #The following two parameters are fetched from the user from the property view: #IndepenentColumns - Column names that you want to use as independent variables for the component. #DependentColumn - Column name that you want to use as a dependent variable for the component. SLR<-function(InputDataFrame,IndepenentColumn,DependentColumn) { finalString<-paste(paste(DependentColumn,"~" ), IndepenentColumn); # Formatting the final string to #pass to "lm" function slr_model<-lm(finalString); # calling the "lm" function and storing the output model in "slr_model" #To get the predicted values for the training data set, call the "predict" function withthis model and #input dataframe, which is represented by "InputDataFrame". result<-predict(slr_model, InputDataFrame); # Storing the predicted values in the "result" variable. output<- cbind(InputDataFrame, result);#combining "InputDataFrame" and "result" to get the final table. plot(slr_model); #Plotting model visualization. # returnvalue - function must always return a list that contains results("out"), and model variable #("slrmodel"), if present. #The output variable stores the final result. #The model variable is used for model scoring. return (list(slrmodel=slr_model,out=output)) } Manual del usuario de SAP Predictive Analysis Adding Custom Component © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 33 #The following is the argument description for the model scoring function "SLRModelScoring": #MInputDataFrame - Dataframe in R that contains the output of the parent component. #MIndepenentColumns - Column names to be used as independent variables for the component. #Model - Model variable that is used for scoring. SLRModelScoring<-function (MInputDataFrame, MIndependentColumn, Model) { #Calling "predict" function to get the predictive value with "Model " and "MInputDataFrame". predicted<-predict (Model, data.frame(MInputDataFrame [, MIndependentColumn]), level=0.95); # returnvalue - function should always return a list that contains the result ("model result"), # The output variable stores the final result return(list(modelresult=predicted)) } A continuación se ofrecen dos ejemplos para convertir un comando R y un formato de función R válido reconocidos por SAP Predictive Analysis: Secuencia de comandos R dataFrame<-read.csv("C:\\CSVs\ \Iris.csv") attach(dataFrame) set.seed(4321) kmeans_model<kmeans(data.frame(`SepalLength`,`Sepa lWidth`, `PetalLength`,`PetalWidth`), centers=5,iter.max=100,nstart=1,algor ithm= "Hartigan-Wong") kmeans_model$cluster dataFrame<read.csv("C:\\Datasets\\cnr\ \Iris.csv") attach(dataFrame) library(rpart) cnr_model<-rpart (Species~PetalLength+PetalWidth +SepalLength+ SepalWidth, method="class") library(rpart) predict(cnr_model, dataFrame,type = c("class")) 34 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Formato de función R (que SAP Predictive Analysis reconoce) kmeansfunction<function(dataFrame,independent, Clustersize,Iterations,algotype,numbe rofinitialdsets) { set.seed(4321) kmeans_model<kmeans(data.frame(dataFrame[,independ ent]), centers=Clustersize,iter.max=Iteratio ns, nstart=numberofinitialdsets, algorithm= algotype) output<- cbind(dataFrame, kmeans_model$cluster); boxplot(output); return (list(out=output)); } cnrFunction<function(dataFrame,IndependentColumns ,dep) { library(rpart); formattedString<paste(IndependentColumns, collapse = '+'); finalString<-paste(paste(dep, "~" ), formattedString); cnr_model<rpart(finalString, method="class"); output<- predict(cnr_model, dataFrame,type=c("class")); out<- cbind(dataFrame, output); return (list(result=out,modelcnr=cnr_model)) ; } Manual del usuario de SAP Predictive Analysis Adding Custom Component Secuencia de comandos R Formato de función R (que SAP Predictive Analysis reconoce) cnrFunctionmodel<function(dataFrame,ind,modelcnr,type) { output<predict(modelcnr,data.frame(dataFram e[,ind]),type=type); out<- cbind(dataFrame, output); return (list(result=out)); 5. En la sección Nombre de la función principal, lleve a cabo los siguientes subpasos: a) En la lista desplegable Nombre de la función principal, seleccione SLR. b) En la lista desplegable Marco de datos de entrada, seleccione InputDataFrame. c) En el cuadro Marcos de entrada de salida, escriba out. d) Seleccione Opción para guardar como modelo. El cuadro Nombre de variable de modelo está habilitado y aparece Detalles de la función Definición de puntaje de modelo. e) En el cuadro Nombre de variable de modelo, escriba slrmodel. 6. En la sección Nombre de la función principal, lleve a cabo los siguientes subpasos: a) En la sección Detalles de la función principal, seleccione Mostrar resumeny la opción para exportar como PMML. b) En la sección Detalles de función de puntaje modelo , desde el Nombre de función de puntaje modelo, seleccione PuntajeModeloSLRM. c) En la lista desplegable Marco de datos de entrada, seleccione MInputDataFrame. d) En el cuadro Marcos de entrada de salida, escriba modelresult. e) En la lista desplegable Nombre de la función principal modelo, seleccione Modelo. 7. Seleccione Siguiente. Aparece la página Opciones. 8. En la sección Opciones de la función principal, lleve a cabo los siguientes subpasos: a) En Definición de tabla de salida, seleccione Considerar ninguna. b) En la lista desplegable Tipo de datos, seleccione Entero. c) En el cuadro Nombre de nueva columna prevista, escriba Predicted column. 9. En la sección Definición de la vista de propiedades, lleve a cabo los siguientes subpasos: a) En Nombre de visualización de propiedad, del cuadro Columna independiente, escriba Independent Column. b) En la lista desplegable Tipo de control, seleccione Selector de columnas (individual)como tipo de control para la Columna independiente. c) En Nombre de visualización de propiedad, del cuadro Columna independiente, escriba Dependent Column. d) En la lista desplegable Tipo de control, seleccione Selector de columnas (individual)como tipo de control paraColumna dependiente. 10. En la sección Opciones de puntaje modelo , en Definición de tabla de salida, seleccione Considerar todas las columnas del componente anterior. 11. En la lista desplegable Tipo de datos, seleccione Entero. 12. En Nombre de nueva columna prevista, escriba Columna de salida. Manual del usuario de SAP Predictive Analysis Adding Custom Component © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 35 13. En la sección Definición de la vista de propiedades, lleve a cabo los siguientes subpasos: a) En Nombre de visualización de propiedad, escriba Independent column. b) En la lista desplegable Tipo de control, seleccione Selector de columnas (individual)como tipo de control para la Columna independiente. 14. Seleccione Finalizar. En función del tipo de análisis realizado, puede crear un modelo como para cualquier otro componente. Enlaces relacionados Asistente de creación de componentes R [página 30] Modelos [página 134] Crear un modelo [página 48] 36 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Adding Custom Component 10 Analizar datos Tras la ejecución del análisis, el resultado de cada componente del análisis se representa mediante distintos gráficos de visualización. Para analizar los datos, realice los siguientes pasos: 1. Después de ejecutar un análisis, cambie a la vista Resultados mediante el botón Resultados de la barra de herramientas. 2. Para mostrar la visualización de un componente, seleccione el componente necesario del análisis en la lista Componente. De forma predeterminada, el resultado del componente se muestra en la vista Tabla. En la siguiente tabla se resumen los componentes y sus gráficos de visualización admitidos. Componentes Gráficos de visualización Orígenes de datos y preprocesadores Gráfico de matriz de dispersión, Gráfico de resumen estadístico, Coordenadas paralelas Algoritmos de agrupación en clúster Gráficos de representación de clúster y resumen de algoritmos Árboles de decisiones Árbol de decisiones, resumen de algoritmos y matriz de confusión Algoritmos de series temporales Gráfico de tendencias, resumen de algoritmos Algoritmos de regresión Gráfico de tendencias, resumen de algoritmos Algoritmos de asociación Gráfico de nube de etiquetas a priori, resumen de algoritmos En la siguiente tabla se resumen los puntos de datos compatibles para su visualización: Nota Si el conjunto de datos de entrada supera el límite de puntos de datos de interactividad, los gráficos se representan sin interactividad. Si el conjunto de datos de entrada supera el límite de puntos de datos de interactividad, los datos que superen ese límite no se muestran en el gráfico. Tabla 3: Gráficos Número máximo de conexiones de datos compatible Con interactividad Sin interactividad Gráfico de tendencias 4000 6000 Gráfico de matriz de dispersión 500 1000 Gráfico de coordenadas paralelas 60000 75000 Manual del usuario de SAP Predictive Analysis Analizar datos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 37 10.1 Gráficos de visualización 10.1.1 Gráfico de matriz de dispersión Los gráficos de matriz de dispersión son matrices de gráficos (gráficos n*n, donde n es el número de atributos seleccionados) que se usan para comparar datos en diferentes dimensiones. De forma predeterminada se seleccionan tres atributos numéricos como máximo para el análisis, comenzando en el primer atributo del origen de datos, y se representa una matriz de gráficos 3*3. No obstante, puede seleccionar manualmente los atributos necesarios desde Indicadores en la sección Datos y actualizar la visualización seleccionando Aplicar. Nota Puede seleccionar un máximo de tres atributos numéricos desde Indicadoresen la sección Datos. 10.1.2 Gráfico de resumen estadístico El resumen estadístico ofrece información de resumen de los atributos numéricos del origen de datos. La información de resumen incluye recuento, valor mínimo, valor máximo, varianza, desviación estándar, suma, media, rango y número de registros. Se representa un gráfico de histograma para cada atributo. 38 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Analizar datos 10.1.3 Coordenadas paralelas Coordinadas paralelas es una técnica de visualización que se usa para visualizar datos multidimensionales y patrones multivariante en los datos del análisis. En este gráfico, de forma predeterminada, los primeros siete atributos se representan con ejes paralelos verticales. Puede seleccionar manualmente los atributos necesarios en la opción Indicadores y actualizar el gráfico eligiendo Aplicar. Cada eje se identifica con el nombre de atributo y los valores mínimo y máximo de los atributos. Las observaciones se representan como series de puntos conectados a lo largo de los ejes paralelos. Puede seleccionar el color por opción para filtrar los datos en función del valor de categoría. Nota Puede seleccionar un máximo de siete atributos numéricos en la sección Indicadores. Manual del usuario de SAP Predictive Analysis Analizar datos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 39 10.1.4 Árbol de decisiones Un árbol de decisiones es una técnica de visualización que permite clasificar observaciones en grupos y predecir eventos futuros basados en un conjunto de reglas de decisiones. Esta presentación se usa para el análisis de árboles de decisiones. Con esta técnica, se elabora un árbol de decisiones binario al dividir las observaciones en subgrupos más pequeños hasta que se cumple el criterio de detención. El nodo de hojas indica los datos clasificados. Se puede agrandar el árbol de decisiones al seleccionar el botón de acercar. Nota La aplicación no puede procesar un árbol de decisiones si existen más de 32 valores categóricos para una columna dependiente. Nota El aspecto del árbol de decisiones difiere según el proveedor de algoritmos. Por ejemplo, el árbol de decisiones para el algoritmo Árbol R-CNR es distinto al árbol de decisiones para el algoritmo HANA C4.5. Cada nodo del árbol de decisiones representa la clasificación de datos en dicho nivel. Puede ver el contenido del nodo al seleccionar 40 en cada nodo. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Analizar datos 10.1.5 Gráfico de tendencias Los gráficos de tendencias se usan para visualizar la correlación entre las variables dependientes e independientes. En el modo de tendencia puede analizar el rendimiento del algoritmo mediante la comparación de las variables dependientes reales con los valores previstos, donde las variables dependientes se representan como un gráfico de barras y los valores previstos como un gráfico de líneas. En el modo de relleno, el algoritmo rellena los valores que faltan y muestra el resultado como un gráfico de líneas. Si el conjunto de datos es muy grande, el gráfico puede ser poco claro. Para mejorar la visibilidad de los datos, use el selector Rango que se encuentra en la parte inferior del gráfico para seleccionar un rango de datos específico del gran conjunto de datos. Los datos del área seleccionada se muestran en el editor de visualización. Manual del usuario de SAP Predictive Analysis Analizar datos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 41 Nota En los gráficos de algoritmo Regresión lineal múltiple (MLR), el atributo de eje x se menciona como ID de registro. 10.1.6 Gráfico de clúster Un gráfico de clúster es una técnica de visualización que usa distintos gráficos para representar información del clúster, como el tamaño del clúster, la densidad y la distancia del clúster, la comparación variable del clúster y la comparación del clúster. Distribución de clúster La distrubución del clúster representa el número de observaciones de cada clúster y se representa mediante un gráfico de barras horizontales. Sin embargo, también puede visualizar la distribución del clúster en un gráfico circular o en un gráfico de barras verticales. Densidad y distancia del clúster La distancia entre los clústeres y la densidad de cada uno se representa mediante un gráfico de redes. Cada nodo de la red representa un clúster y su tamaño. El color del nodo representa la densidad. Distribución de características La comparación de la distribución total de todos los clústeres en relación a la distribución de cada clúster se representa mediante un histograma. Puede seleccionar la medida necesaria desde Medidasen la sección Datos. Puede visualizar la distribución de características de cada clúster seleccionando el número de Clústersen la secciónDatos. Representación de centro de clúster El algoritmo de medios K calcula los puntos centrales para las características de cada clúster. La comparación de cada punto central y clúster se representa mediante un gráfico radial. Por defecto, se muestra el gráfico con datos normalizados. En el modo normalizado, los datos se representan en un rango de 0 a 1. Sin embargo, puede deseleccionar la opción Normalizar resultadodesde Opciones. 42 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Analizar datos 10.1.7 Gráfico de nube de etiquetas a priori El gráfico de nube de etiquetas a priori le permite visualizar y encontrar elementos concretos frecuentes, según la regla de asociación. En este gráfico de visualización, las reglas más importantes son las más fuertes. La importancia de las reglas varía según la confianza y el valor de elevación. Cuanto más alto es el valor de confianza más profundo es el color de las normas y más alto es el valor de elevación y más grande la fuente de las normas. Puede modificar el valor del soporte, la confianza y los valores de elevación ajustando los controles deslizantes de rango desde el panel Datos. 10.1.8 Matriz de confusión Una matriz de confusión contiene información acerca de la clasificación real y predictiva realizada por un algoritmo, lo que permite visualizar la exactitud. Puede ver el gráfico al seleccionar el método de salida Clasificación y Tendencia para el algoritmo de árbol CNR. Se trata de una matriz n*n (en la que n es el número de valores únicos presentes en la columna dependiente seleccionada para el algoritmo), que asigna el número de sucesos para cada valor previsto teniendo en cuenta el valor real. Las entradas en la diagonal de la matriz representan la predicción correcta. Las entradas fuera de la diagonal de la matriz representan la clasificación errónea. Manual del usuario de SAP Predictive Analysis Analizar datos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 43 44 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Analizar datos 11 Crear gráficos para visualizar los datos Usa la ficha de Visualizar para crear gráficos a partir de una gran selección de familias de gráficos. En la ficha Visualizar, puede acceder a conjuntos de datos predictivos mediante las listas desplegables Análisis y Componentes. A partir de SAP Predictive Analysis 1.14 en adelante, puede guardar la creación de gráficos mediante los conjuntos de datos predictivos y compartirlos. Para obtener más información sobre cómo crear gráficos, consulte la sección Crear gráficos para sus datos en el Manual de usuario de SAP Lumira disponible en: http://help.sap.com/lumira. Manual del usuario de SAP Predictive Analysis Crear gráficos para visualizar los datos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 45 12 Crear guiones para sus datos Puede crear guiones que proporcionen una narrativa gráfica para describir sus datos al agrupar gráficos en cuadros para crear cuadros de mandos simples de estilo de presentación. Al agregar imágenes y texto puede anotar y añadir detalles de la presentación. Puede grabar los guiones como parte del documento. A partir de SAP Predictive Analysis 1.14 en adelante, puede crear guiones en conjuntos de datos predictivos mediante las listas desplegables Análisis y Componentes en la ficha Crear. Para obtener más información sobre cómo crear guiones, consulte la sección Crear guiones para sus datos en el Manual de usuario de SAP Lumira disponible en: http://help.sap.com/lumira. 46 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Crear guiones para sus datos 13 Compartir gráficos y conjuntos de datos A partir de SAP Predictive Analysis 1.14 en adelante, puede publicar conjuntos de datos predictivos en SAP HANA, SAP Streamwork o Explorer, exportar a formatos de archivo de Microsoft Excel o CSV o enviar sus gráficos a sus colegas por correo electrónico o imprimirlos en formato PDF. En la ficha Compartir, puede acceder a conjuntos de datos predictivos desde la sección CONJUNTOS DE DATOS. Para obtener más información sobre cómo compartir gráficos y conjuntos de datos, consulte la sección Compartir gráficos y conjuntos de datos en el Manual de usuario de SAP Lumira disponible en: http:// help.sap.com/lumira. Manual del usuario de SAP Predictive Analysis Compartir gráficos y conjuntos de datos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 47 14 Trabajar con modelos Un modelo es un componente reutilizable que se crea formando un algoritmo con datos históricos y guardando a continuación la instancia. Normalmente creará modelos por los siguientes motivos: ● Para compartir reglas empresariales de cálculo que se pueden aplicar a datos similares ● Para predecir datos invisibles utilizando la instacia de formación del algoritmo 14.1 Crear un modelo Para crear un modelo, debe guardar el estado del algoritmo. 1. Adquiera datos del origen de datos necesario. El componente de origen de datos se agrega al editor de análisis en la ficha Predecir. 2. En la ficha Predecir, haga doble clic en el componente de algoritmo R necesario. 3. Desde el menú contextual del componente, seleccione Configurar opciones. 4. Seleccione 5. Desde el menú contextual del algoritmo, seleccione Guardar como modelo. 6. Especifique un nombre y una descripción para el modelo. 7. Si ya existe un modelo con el mismo nombre, seleccione la opción Sobrescribir si existe para sobrescribir el modelo existente. 8. Seleccione Guardar. 9. Seleccione OK. Ejecutar. El modelo se crea y aparece en la sección Modelos de la lista Componentes. Puede usar este modelo del mismo modo que cualquier otro componente para crear un análisis. Nota Los nombres de columnas independientes que se usan al calcular el modelo deberían ser los mismos que los nombres de columnas independientes que se usan al crear el modelo. 14.2 Exportar un modelo como PMML Puede exportar información del modelo a un archivo local en el formato estándar del sector Predictive Modeling Markup Language (PMML) y compartir el modelo con otras aplicaciones que admitan PMML para analizar conjuntos de datos similares. Para exportar un modelo en el formato PMML, realice los siguientes pasos: 1. 48 Cree un modelo. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Trabajar con modelos 2. En la fichal Predecir, en la sección Modelos, haga doble clic en el modelo que desee. 3. Desde el menú contextual del componente, seleccione Exportar modelo. 4. Seleccione Utilizar esta opción para exportar modelos de datos al archivo Predictive Model Markup Language (*.pmml). 5. Seleccione Exportar. 6. Introduzca un nombre para el archivo. 7. Seleccione el tipo de archivo, PMML o XML, según sea necesario. 8. Seleccione Guardar. 14.3 Exportar un modelo a un archivo .spar Puede exportar un modelo en un archivo .spar y compartirlo con sus compañeros. Para exportar un modelo, realice los siguientes pasos: 1. Cree un modelo. 2. Seleccione el modelo que desee exportar y, de las acciones de componente, seleccione Exportar modelos o arrastre el modelo en el editor de análisis o del menú contextual, seleccione Exportar modelo. 3. Seleccione Utilizar esta opción para exportar modelo de datos al archivo (.spar). 4. Seleccione Exportar. 5. Introduzca un nombre para el archivo .spar. 6. Seleccione Guardar. 7. Seleccione OK. Para exportar varios modelos a un solo archivo .spar file, seleccione Seleccione los modelos que desee exportar y seleccione Exportar. Archivo Exportar todos los modelos . 14.4 Exportar un modelo PAL de SAP HANA como procedimiento almacenado Puede exportar un modelo PAL de SAP HANA como procedimiento almacenado en la base de datos de SAP HANA y cualquier usuario puede utilizar estos modelos para el análisis. Antes de exportar un modelo de SAP HANA como modelo almacenado, asegúrese de que su cuenta está definida en SAP HANA. 1. Cree un modelo. 2. En la ficha Predecir, en la lista Componentes, seleccione Modelos. 3. Seleccione el modelo necesario y, de la sección Acciones de componente, seleccione Exportar modelo. 4. Seleccione Utilizar esta opción para exportar un modelo de SAP HANA como procedimiento almacenado. 5. Seleccione Exportar. Manual del usuario de SAP Predictive Analysis Trabajar con modelos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 49 6. Seleccione el esquema necesario en el que desee que aparezca el procedimiento. 7. Especifique un nombre para el procedimiento. Nota Si desea sobrescribir el procedimiento existente con el mismo nombre en el esquema seleccionado, seleccione Sobrescribir si existe. 8. Seleccione Exportar. El procedimiento exportado y los objetos asociados al procedimiento (tablas/tipos) aparecen en el esquema seleccionado en la base de datos de SAP HANA. 14.4.1 Eliminar el procedimiento almacenado exportado de SAP HANA Puede eliminar el procedimiento almacenado exportado de SAP HANA mediante SAP HANA Studio. Asegúrese de que la cuenta está definida en SAP HANA. Para eliminar el procedimiento almacenado exportado de SAP HANA, lleve a cabo los siguientes pasos: 1. En SAP HANA Studio, desplácese al procedimiento que ha exportado. Nota Puede encontrar el procedimiento exportado en la carpeta Procedure del esquema. 2. Haga clic con el botón derecho en el procedimiento y seleccione Abrir definición. Aparece la ficha Definición. 3. En la ficha Definición, seleccione la ficha Crear declaración. 4. En la ficha Crear declaración, copie los comentarios SQL (comandos precedidos por guiones dobles '--'). 5. En la ficha Navegación, haga clic con el botón derecho en el procedimiento y seleccione Consola SQL. Aparece la ficha Consola SQL. 6. En la ficha Consola SQL, pegue los comentarios SQL y seleccione Ejecutar o pulse F8. Nota Asegúrese de eliminar los guiones dobles (- -), que preceden a los comentarios SQL, antes de ejecutar los comentarios. 14.5 Importar un modelo Puede importar un modelo compartido por su compañero y utilizarlo de análisis. Para importar un modelo, realice los siguientes pasos: 50 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Trabajar con modelos 1. En la pestañaPredecir, en la lista de Componentes, seleccione Importar modelo . 2. Seleccione un archivo .spar válido y, a continuación, seleccione Abrir. 3. Seleccione los modelos que desee importar y seleccione Finalizar. El modelo se importa y aparece en la sección Modelos de la lista Componentes. 14.6 Eliminar un modelo Le recomendamos que use esta opción con precaución, dado que la eliminación de un modelo puede inutilizar los análisis que contienen referencias al modelo. Para eliminar un modelo, realice los siguientes pasos: 1. En la ficha Predecir, en la lista Componentes, seleccione Modelos. 2. Seleccione el modelo necesario y, de las acciones de componente, seleccione Eliminar. Manual del usuario de SAP Predictive Analysis Trabajar con modelos © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 51 15 Propiedades de los componentes 15.1 Algoritmos Use algoritmos para realizar tareas de minería y análisis estadísticos de datos. Por ejemplo, para determinar cuáles son las tendencias y los patrones de los datos. SAP Predictive Analysis ofrece algoritmos integrados como regresiones, series temporales y valores atípicos. Sin embargo, la aplicación también admite algoritmos de árboles de decisiones, medios K, red neuronal, series temporales y regresión de la biblioteca R de código abierto. También puede realizar análisis dentro de la base de datos con algoritmos de la Biblioteca de Predictive Analysis (PAL) desde SAP HANA. 15.1.1 Regresión 15.1.1.1 Regresión exponencial de HANA Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina la forma en la que una variable concreta influye en otra variable mediante una función exponencial. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión exponencial de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columnas independientes Seleccione las columnas de entrada con las que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. 52 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Ignorar: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Mantener el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Nombre de columna prevista Introduzca un nombre para la columna recién añadida que contiene los valores previstos. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. 15.1.1.2 Regresión geométrica de HANA Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina la forma en la que una variable concreta influye en otra variable mediante una función geométrica. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión geométrica de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columnas independientes Seleccione las columnas de entrada con las que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 53 Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Nombre de columna prevista Introduzca un nombre para la columna recién añadida que contiene los valores previstos. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. 15.1.1.3 Regresión lineal múltiple de HANA Sintaxis Use este algoritmo para buscar la relación lineal entre una variable dependiente y una o varias variables independientes. Propiedades de la regresión lineal múltiple de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columnas independientes Seleccione las columnas de entrada con las que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: 54 ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. 15.1.1.4 Regresión logarítmica de HANA Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza análisis de regresión logarítmica de bivariable. Determina el modo en que una variable individual influye en otra variable mediante la función logarítmica de la Biblioteca de Predictive Analysis (PAL). Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión logarítmica de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columna independiente Seleccione las columnas de entrada con las que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Nombre de columna prevista Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 55 Introduzca un nombre para la columna recién creada que contiene los valores previstos. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. 15.1.1.5 Regresión polinómica de HANA Sintaxis Use este algoritmo para buscar la relación entre la variable independiente y la variable dependiente de una línea ajustada curvilínea. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión polinomial de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columnas independientes Seleccione las columnas de entrada con las que desea realizar la regresión. Grado del ajuste polinomial Introduzca el mayor valor exponencial de una expresión polinomial. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Ignorar: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Mantener el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Nombre de columna prevista 56 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Introduzca un nombre para la columna recién creada que contiene los valores previstos. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. 15.1.1.6 Regresión lineal múltiple R de HANA Sintaxis Use este algoritmo para buscar la relación lineal entre una variable dependiente y una o varias variables independientes. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión lineal múltiple R de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columnas independientes Seleccione las columnas de entrada con las que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Nivel de confianza Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 57 Introduzca el nivel de confianza del algoritmo (la precisión de las predicciones). El valor predeterminado es 0,95. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. 15.1.1.7 Regresión logística de HANA Sintaxis Use este algoritmo cuando las variables independientes son categóricas o una mezcla de valores continuos y categóricos. La Regresión logística es un enfoque de predicción parecido a la regresión de Mínimos cuadrados ordinarios (OLS). Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión logística de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. ● Relleno: rellena los valores faltantes en la columna de destino. Columnas independientes Seleccione las columnas de entrada con las que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Procedimiento de iteración Seleccione el procedimiento de iteración. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: 58 ● Ignorar: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Mantener el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Visualizar valores ajustados Seleccione la opción para ver los valores ajustados en una nueva columna. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Repetición máxima Indique la cantidad máxima de repeticiones permitidas para calcular el coeficiente del algoritmo. El valor predeterminado es 100. Umbral de salida Introduzca el valor de umbral para salir de las repeticiones. El valor predeterminado es 0,00001. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 4. Valor de asignación para 0 Indique un valor para una variable, el cual estará asignado a 0. Valor de asignación para 1 Indique un valor para una variable, el cual estará asignado a 1. 15.1.1.8 Regresión exponencial R Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina el modo en que una única variable influye en otra variable mediante una función exponencial de la biblioteca de código abierto R. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión exponencial R Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 59 Columna independiente Seleccione la columna de entrada con la que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Ignorar: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Permitir ajuste singular Valor booleano; si se define con el valor verdadero, los coeficientes con alias se pasan por alto en la matriz de covarianza de coeficientes. Si se define con el valor falso, los modelos con coeficientes con alias producen un error. Un modelo con coeficientes con alias significa que la matriz cuadrada x*x es singular. Contrastes Seleccione la lista de contrastes que desea usar para los factores que aparecen como variables en el modelo. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. 15.1.1.9 Regresión geométrica R Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina el modo en que una única variable influye en otra variable mediante una función geométrica de la biblioteca de código abierto R. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión geométrica R Modo de salida 60 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columna independiente Seleccione la columna de entrada con la que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Ignorar: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Permitir ajuste singular Valor booleano; si se define con el valor verdadero, los coeficientes con alias se pasan por alto en la matriz de covarianza de coeficientes. Si se define con el valor falso, los modelos con coeficientes con alias producen un error. Un modelo con coeficientes con alias significa que la matriz cuadrada x*x es singular. Contrastes Seleccione la lista de contrastes que desea usar para los factores que aparecen como variables en el modelo. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. 15.1.1.10 Regresión lineal R Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina el modo en que una única variable influye en otra variable mediante la biblioteca de código abierto R. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 61 Propiedades de la regresión lineal R Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columna independiente Seleccione la columna de entrada con la que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Ignorar: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Permitir ajuste singular Valor booleano; si se define con el valor verdadero, los coeficientes con alias se pasan por alto en la matriz de covarianza de coeficientes. Si se define con el valor falso, los modelos con coeficientes con alias producen un error. Un modelo con coeficientes con alias significa que la matriz cuadrada x*x es singular. Contrastes Seleccione la lista de contrastes que desea usar para los factores que aparecen como variables en el modelo. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. 15.1.1.11 Regresión logarítmica R Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina el modo en que una única variable influye en otra variable mediante una función logarítmica de la biblioteca de código abierto R. 62 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión logarítmica R Modo de salida Seleccione el modo en el que desea mostrar los datos de salida. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columna independiente Seleccione la columna de origen de entrada con la que desea realizar la regresión. Columna dependiente Seleccione la columna de destino en la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Permitir ajuste singular Valor booleano; si se define con el valor verdadero, los coeficientes con alias se pasan por alto en la matriz de covarianza de coeficientes. Si se define con el valor falso, los modelos con coeficientes con alias producen un error. Un modelo con coeficientes con alias significa que la matriz cuadrada x*x es singular. Contrastes Seleccione la lista de contrastes que se va a usar para los factores que aparecen como variables en el modelo. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 63 15.1.1.12 Regresión lineal múltiple R Sintaxis Use este algoritmo para buscar la relación lineal entre una variable dependiente y una o varias variables independientes. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión lineal múltiple R Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columnas independientes Seleccione las columnas de entrada con las que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: conserva los valores que faltan. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna dependiente o independiente. Nivel de confianza Indique el nivel de confianza del algoritmo. El valor predeterminado es 0,95. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. 64 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 15.1.1.13 Regresión exponencial Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina cómo una variable individual influencia a otra variable mediante una función exponencial con la metodología de mínimo cuadrado. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión exponencial Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Modos posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columna independiente Seleccione la columna de entrada con la que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 65 15.1.1.14 Regresión geométrica Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina cómo una variable individual influencia a otra variable mediante una función geométrica con la metodología de mínimo cuadrado. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión geométrica Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columna independiente Seleccione la columna de entrada con la que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Detener: El algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Nombre de columna prevista Introduzca un nombre para la columna creada recientemente que contiene los valores previstos. 66 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 15.1.1.15 Regresión lineal Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina cómo una variable individual influencia a otra variable mediante la metodología de mínimo cuadrado. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión lineal Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columna independiente Seleccione la columna de entrada con la que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 67 15.1.1.16 Regresión logarítmica Sintaxis Use este algoritmo para detectar tendencias en los datos. Este algoritmo realiza un análisis de regresión de una sola variable. Determina cómo una variable individual influencia a otra variable mediante una función logarítmica con la metodología de mínimo cuadrado. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de la regresión logarítmica Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Relleno: rellena los valores faltantes en la columna de destino. ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. Columna independiente Seleccione la columna de entrada con la que desea realizar la regresión. Columna dependiente Seleccione la columna de destino para la que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Ignorar: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. 68 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 15.1.2 Valores atípicos 15.1.2.1 Detección de anomalías de HANA Sintaxis Use este algoritmo para buscar modelos en los datos que no se ajusten al comportamiento previsto. Nota No se admite la creación de modelos mediante el algoritmo de detección de anomalías de HANA. Propiedades de la detección de anomalías de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Columnas independientes Seleccione las columnas de origen de entrada. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Porcentaje de anomalías Introduzca el porcentaje del valor que indica la proporción de anomalías que hay en los datos de origen. El valor predeterminado es 10. Método de detección de anomalías Seleccione el método de detección de anomalías. ● Por distancia del centro ● Por la suma de distancias de todos los centros Repeticiones máximas Introduzca el número de repeticiones permitidas para buscar clústeres. El valor predeterminado es 100. Método de cálculo central Seleccione el método para calcular los centros del clúster inicial. Tipo de normalización Seleccione el tipo de normalización. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 69 Número de clústeres Introduzca el número de grupos para la agrupación en clúster. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. Umbral de salida Introduzca el valor de umbral para salir de las repeticiones. El valor predeterminado es 0,0001. Medición de distancia Introduzca el medidor para calcular la distancia entre el elemento y el centro del clúster. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores previstos. 15.1.2.2 Prueba de rangos intercuartil de HANA Sintaxis Use este algoritmo para encontrar valores atípicos según la distribución estadística entre el primer y el tercer cuartil. Nota ● Los datos de entrada del algoritmo de la prueba IQR (rangos intercuartil) deben tener como mínimo cuatro filas. ● No se admite la creación de modelos mediante el algoritmo de prueba del rango intercuartil de HANA. Propiedades de la prueba de rangos intercuartil de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Mostrar valores atípicos: agrega una columna booleana a los datos de entrada donde se especifica si el valor correspondiente es un valor atípico. ● Eliminar valores atípicos: elimina los valores atípicos de los datos de entrada. Columna independiente Seleccione una columna de origen de entrada. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: 70 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Coeficiente Fence Introduzca la desviación permitida para los valores desde el rango intercuartil. El valor predeterminado es 1,5. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores previstos. 15.1.2.3 Rango intercuartil Sintaxis Use este algoritmo para encontrar valores atípicos según la distribución estadística entre el primer y el tercer cuartil. Nota ● Los datos de entrada del algoritmo de IQR (rango intercuartil) deben tener como mínimo cuatro filas. ● No se admite la creación de modelos mediante el algoritmo de rango intercuartil. Propiedades del rango intercuartil Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Mostrar valores atípicos: agrega una columna booleana a los datos de entrada donde se especifica si el valor correspondiente es un valor atípico. ● Eliminar valores atípicos: elimina los valores atípicos de los datos de entrada. Característica Seleccione la columna de entrada con la que desea realizar el análisis. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 71 Coeficiente Fence Introduzca la desviación permitida para los valores desde el rango intercuartil. El valor predeterminado es 1.5. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores previstos. 15.1.2.4 Valor atípico de vecino más próximo Sintaxis Use este algoritmo para buscar valores atípicos según el número de vecinos (N) y la distancia promedia de los valores comparados con los vecinos N más próximos. Nota No se admite la creación de modelos mediante el valor atípico de vecino más próximo. Propiedades del valor atípico de vecino más próximo Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Mostrar valores atípicos: agrega una columna booleana a los datos de entrada donde se especifica si el valor correspondiente es un valor atípico. ● Eliminar valores atípicos: elimina los valores atípicos de los datos de entrada. Característica Seleccione la columna de entrada con la que desea realizar el análisis. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Recuento de vecinos Introduzca el número de vecinos para encontrar distancias. El valor predeterminado es 5. Número de valores atípicos Introduzca el número de valores atípicos que desea eliminar. Nombre de columna prevista 72 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Introduzca un nombre para la nueva columna que contiene los valores previstos. 15.1.2.5 Prueba de varianza de HANA Sintaxis La prueba de varianza de HANA identifica los valores atípicos de un conjunto de datos numéricos. Los límites superior e inferior de los datos se calculan según en medio y la desviación estándar de los datos y el valor de multiplicador que se proporcione. El multiplicador es un coeficiente de tipo doble, que ayuda a probar si los valores de un vector numérico están dentro del rango. Si el valor se encuentra fuera del rango, sugiere que no pasa la prueba de varianza y, por lo tanto, el valor se marca como un valor atípico. Nota No se admite la creación de modelos mediante el algoritmo de detección de anomalías de HANA. Propiedades de la prueba de varianza de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. ● Mostrar valores atípicos: agrega una columna booleana a los datos de entrada donde se especifica si el valor correspondiente es un valor atípico. ● Eliminar valores atípicos: elimina los valores atípicos de los datos de entrada. Columnas independientes Seleccione las columnas de origen de entrada. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Multiplicador Indique el valor de multiplicador para decidir el rango del los límites inferior y superior, el cual le ayudará a identificar los valores atípicos. El valor predeterminado es 3,0. Nota El valor de entrada debe ser un valor entero. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 73 Número de subprocesos Indique la cantidad de subprocesos que debe usar el algoritmo durante la ejecución. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores previstos. 15.1.3 Serie temporal 15.1.3.1 Suavizado exponencial único de HANA Sintaxis Use este algoritmo para suavizar los datos de origen. Nota No se admite la creación de modelos mediante el algoritmo de suavizado exponencial único de HANA. Propiedades del suavizado exponencial único de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. ● Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto de datos determinado. ● Previsión: muestra los valores previstos de un período determinado. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo. Período Seleccione el período para la predicción. Períodos por año Seleccione el período para la predicción. Esta opción solo esta activada si selecciona "Personalizar" para "Período". Año inicial Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009, 1987, 2019. Período de inicio Introduzca el período del que se deben tener en cuenta las observaciones. El valor predeterminado es 1. Períodos para predecir 74 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Introduzca el número de períodos para prever. Este valor se utiliza únicamente si el modo de salida es Previsión. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Valores de año Introduzca un nombre para la columna recién creada que contiene los valores de año. Valores de trimestre Introduzca un nombre para la columna recién creada que contiene los valores de trimestre. Valores de mes Introduzca un nombre para la columna recién creada que contiene los valores de mes. Valores de período Introduzca un nombre para la columna recién creada que contiene los valores de período. Alfa Introduzca una constante de suavizado para suavizar las observaciones (parámetros de base). Rango: 0-1. 15.1.3.2 Suavizado exponencial doble de HANA Sintaxis Use este algoritmo para suavizar los datos de origen. Nota No se admite la creación de modelos mediante el algoritmo de suavizado exponencial doble de HANA. Propiedades del suavizado exponencial doble de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. ● Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto de datos determinado. ● Previsión: muestra los valores previstos de un período determinado. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo. Período Seleccione el período para la predicción. Períodos por año Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 75 Seleccione el período para la predicción. Esta opción solo esta activada si selecciona "Personalizar" para "Período". Año inicial Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009, 1987, 2019. Período de inicio Introduzca el período del que se deben tener en cuenta las observaciones. Períodos para predecir Introduzca el número de períodos para prever. Este valor se utiliza únicamente si el modo de salida es Previsión. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Valores de año Introduzca un nombre para la columna recién creada que contiene los valores de año. Valores de trimestre Introduzca un nombre para la columna recién creada que contiene los valores de trimestre. Valores de mes Introduzca un nombre para la columna recién creada que contiene los valores de mes. Valores de período Introduzca un nombre para la columna recién creada que contiene los valores de período. Alfa Introduzca una constante de suavizado para suavizar las observaciones (parámetros de base). Rango: 0-1. Beta Introduzca una constante de suavizado para buscar parámetros de tendencias. Rango: 0-1. 15.1.3.3 Suavizado exponencial triple de HANA Sintaxis Use este algoritmo para suavizar los datos de origen y descubrir tendencias estacionales en los datos. Nota No se admite la creación de modelos mediante el algoritmo de suavizado exponencial triple de HANA. 76 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Propiedades del suavizado exponencial triple de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. ● Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto de datos determinado. ● Previsión: muestra los valores previstos de un período determinado. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo. Período Seleccione el período para la predicción. Períodos por año Seleccione el período para la predicción. Esta opción solo esta activada si selecciona "Personalizar" para "Período". Año inicial Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009, 1987, 2019. Período de inicio Introduzca el período del que se deben tener en cuenta las observaciones. Períodos para predecir Introduzca el número de períodos para prever. Este valor se utiliza únicamente si el modo de salida es Previsión. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Valores de año Introduzca un nombre para la columna recién creada que contiene los valores de año. Valores de trimestre Introduzca un nombre para la columna recién creada que contiene los valores de trimestre. Valores de mes Introduzca un nombre para la columna recién creada que contiene los valores de mes. Valores de período Introduzca un nombre para la columna recién creada que contiene los valores de período. Alfa Introduzca una constante de suavizado para suavizar las observaciones (parámetros de base). Rango: 0-1. Beta Introduzca una constante de suavizado para buscar parámetros de tendencias. Rango: 0-1. Gamma Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 77 Introduzca una constante de suavizado para buscar parámetros de tendencias estacionales. Rango: 0-1. 15.1.3.4 Suavizado exponencial triple R de HANA Sintaxis Use este algoritmo para suavizar los datos de origen y descubrir tendencias estacionales en los datos. Propiedades del suavizado exponencial triple R de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. ● Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto de datos determinado. ● Previsión: muestra los valores previstos de un período determinado. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo. Período Seleccione el período para la predicción. Períodos por año Seleccione el período para la predicción. Esta opción solo esta activada si selecciona "Personalizar" para "Período". Año inicial Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009, 1987, 2019. Período de inicio Introduzca el período del que se deben tener en cuenta las observaciones. Períodos para predecir Introduzca el número de períodos para prever. Este valor se utiliza únicamente si el modo de salida es Previsión. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Valores de año Introduzca un nombre para la columna recién creada que contiene los valores de año. Valores de trimestre Introduzca un nombre para la columna recién creada que contiene los valores de trimestre. Valores de mes 78 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Introduzca un nombre para la columna recién creada que contiene los valores de mes. Valores de período Introduzca un nombre para la columna recién creada que contiene los valores de período. Alfa Introduzca una constante de suavizado para suavizar las observaciones (parámetros de base). Rango: 0-1. Beta Introduzca una constante de suavizado para buscar parámetros de tendencias. Rango: 0-1. Gamma Introduzca una constante de suavizado para buscar parámetros de tendencias estacionales. Rango: 0-1. Estacionario Seleccione el tipo de algoritmo de suavizado exponencial HoltWinters. Nivel de confianza Indique el nivel de confianza del algoritmo. Número de observaciones periódicas Introduzca el número de observaciones periódicas necesarias para iniciar el cálculo. Nivel Introduzca el valor de inicio del nivel (a[0]) (l.start). Por ejemplo: 0.4 Tendencia Introduzca el valor de inicio para descubrir parámetros de tendencias (b[0]) (b.start). Por ejemplo: 0.4 Estación Introduzca los valores de inicio para descubrir parámetros estacionales (s.start). Este valor depende de la columna que se seleccione. Por ejemplo, si selecciona trimestre como período, tiene que proporcionar cuatro valores dobles. Entradas de optimizador Introduzca los valores de inicio de alfa, beta y gamma necesarios para el optimizador. Por ejemplo: 0.3, 0.1, 0.1 15.1.3.5 Suavizado exponencial único R Sintaxis Use este algoritmo para suavizar los datos de origen. Nota No se admite la creación de modelos mediante el algoritmo de suavizado exponencial único R de HANA. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 79 Propiedades del suavizado exponencial único R Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. ● Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto de datos determinado. ● Previsión: muestra los valores previstos de un período determinado. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo. Período Seleccione el período para la predicción. Períodos por año Seleccione el período para la predicción. Esta opción solo esta activada si selecciona "Personalizar" para "Período". Año inicial Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009, 1987, 2019. Período de inicio Introduzca el período del que se deben tener en cuenta las observaciones. Períodos para predecir Introduzca el número de períodos para predecir. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Valores de año Introduzca un nombre para la columna recién creada que contiene los valores de año. Valores de trimestre Introduzca un nombre para la columna recién creada que contiene los valores de trimestre. Valores de mes Introduzca un nombre para la columna recién creada que contiene los valores de mes. Valores de período Introduzca un nombre para la columna recién creada que contiene los valores de período. Alfa Introduzca una constante de suavizado para suavizar las observaciones (parámetros de base). El valor predeterminado es 0,3. Rango: 0-1. Nivel de confianza Indique el nivel de confianza del algoritmo. Número de observaciones periódicas Introduzca el número de observaciones periódicas necesarias para iniciar el cálculo. El valor predeterminado es 2. Nivel 80 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Introduzca el valor de inicio del nivel (a[0]) (l.start). Por ejemplo: 0.4 15.1.3.6 Suavizado exponencial doble R Sintaxis Use este algoritmo para suavizar los datos de origen y descubrir tendencias en los datos. Nota No se admite la creación de modelos mediante el algoritmo de suavizado exponencial doble R de HANA. Propiedades del suavizado exponencial doble R Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. ● Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto de datos determinado. ● Previsión: muestra los valores previstos de un período determinado. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo. Período Seleccione el período para la predicción. Períodos por año Seleccione el período para la predicción. Esta opción solo esta activada si selecciona "Personalizar" para "Período". Año inicial Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009, 1987, 2019. Período de inicio Introduzca el período del que se deben tener en cuenta las observaciones. Períodos para predecir Introduzca el número de períodos para predecir. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Valores de año Introduzca un nombre para la columna recién creada que contiene los valores de año. Valores de trimestre Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 81 Introduzca un nombre para la columna recién creada que contiene los valores de trimestre. Valores de mes Introduzca un nombre para la columna recién creada que contiene los valores de mes. Valores de período Introduzca un nombre para la columna recién creada que contiene los valores de período. Alfa Introduzca una constante de suavizado para suavizar las observaciones (parámetros de base). El valor predeterminado es 0,3. Rango: 0-1. Beta Introduzca una constante de suavizado para buscar parámetros de tendencias. El valor predeterminado es 0,1. Rango: 0-1. Nivel de confianza Indique el nivel de confianza del algoritmo. Número de observaciones periódicas Introduzca el número de observaciones periódicas necesarias para iniciar el cálculo. El valor predeterminado es 2. Nivel Introduzca el valor de inicio del nivel (a[0]) (l.start). Por ejemplo: 0.4 Tendencia Introduzca el valor de inicio para descubrir parámetros de tendencias (b[0]) (b.start). Por ejemplo: 0.4 Entradas de optimizador Introduzca los valores de inicio de alfa, beta y gamma necesarios para el optimizador. Por ejemplo: 0.3, 0.1, 0.1 15.1.3.7 Suavizado exponencial triple R Sintaxis Use este algoritmo para suavizar los datos de origen y descubrir tendencias estacionales en los datos. Nota No se admite la creación de modelos mediante el algoritmo de suavizado exponencial triple R de HANA. Propiedades del suavizado exponencial triple R Modo de salida 82 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Seleccione el modo en el que desea usar la salida de este algoritmo. ● Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto de datos determinado. ● Previsión: muestra los valores previstos de un período determinado. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo. Período Seleccione el período para la predicción. Períodos por año Seleccione el período para la predicción. Esta opción solo esta activada si selecciona "Personalizar" para "Período". Año inicial Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009, 1987, 2019. Período de inicio Introduzca el período del que se deben tener en cuenta las observaciones. Períodos para predecir Introduzca el número de períodos para predecir. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Valores de año Introduzca un nombre para la columna recién creada que contiene los valores de año. Valores de trimestre Introduzca un nombre para la columna recién creada que contiene los valores de trimestre. Valores de mes Introduzca un nombre para la columna recién creada que contiene los valores de mes. Valores de período Introduzca un nombre para la columna recién creada que contiene los valores de período. Alfa Introduzca una constante de suavizado para suavizar las observaciones (parámetros de base). El valor predeterminado es 0,3. Rango: 0-1. Beta Introduzca una constante de suavizado para buscar parámetros de tendencias. El valor predeterminado es 0,1. Rango: 0-1. Gamma Introduzca una constante de suavizado para buscar parámetros de tendencias estacionales. El valor predeterminado es 0,1. Estacionario Seleccione el tipo de algoritmo de suavizado exponencial HoltWinters. Nivel de confianza Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 83 Indique el nivel de confianza del algoritmo. Número de observaciones periódicas Introduzca el número de observaciones periódicas necesarias para iniciar el cálculo. El valor predeterminado es 2. Nivel Introduzca el valor de inicio del nivel (a[0]) (l.start). Por ejemplo: 0.4 Tendencia Introduzca el valor de inicio para descubrir parámetros de tendencias (b[0]) (b.start). Por ejemplo: 0.4 Estación Introduzca los valores de inicio para descubrir parámetros estacionales (s.start). Este valor depende de la columna que se seleccione. Por ejemplo, si selecciona trimestre como período, tiene que proporcionar cuatro valores dobles. Entradas de optimizador Introduzca los valores de inicio de alfa, beta y gamma necesarios para el optimizador. Por ejemplo: 0.3, 0.1, 0.1 15.1.3.8 Triple Exponential Smoothing Sintaxis Use this algorithm to smooth the source data and find seasonal trends in data. Triple Exponential Smoothing Properties Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. ● Tendencia: muestra los datos de origen junto con los valores predichos de un conjunto de datos determinado. ● Previsión: muestra los valores previstos de un período determinado. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis de serie de tiempo. Tener en cuenta columna de fecha Seleccione esta opción para especificar si se va a usar la columna de fecha. Columna de fecha Introduzca el nombre de la columna que contiene los valores de fecha. Período Seleccione el período para la predicción. Períodos por año 84 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Seleccione el período para la predicción. Esta opción solo esta activada si selecciona "Personalizar" para "Período". Año inicial Introduzca el año del que se deben tener en cuenta las observaciones. Por ejemplo, 2009, 1987, 2019. Período de inicio Introduzca el período del que se deben tener en cuenta las observaciones. Períodos para predecir Introduzca el número de períodos para predecir. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Valores de año Introduzca un nombre para la columna recién creada que contiene los valores de año. Valores de trimestre Introduzca un nombre para la columna recién creada que contiene los valores de trimestre. Valores de mes Introduzca un nombre para la columna recién creada que contiene los valores de mes. Valores de período Introduzca un nombre para la columna recién creada que contiene los valores de período. Alfa Introduzca una constante de suavizado para suavizar las observaciones (parámetros de base). El valor predeterminado es 0,3. Rango: 0-1. Beta Introduzca una constante de suavizado para buscar parámetros de tendencias. El valor predeterminado es 0,1. Rango: 0-1. Gamma Introduzca una constante de suavizado para buscar parámetros de tendencias estacionales. El valor predeterminado es 0,1. Rango: 0-1. 15.1.4 Árboles de decisiones 15.1.4.1 HANA C 4.5 Sintaxis Use este algoritmo para clasificar las observaciones en grupos y predecir una o varias variables discretas según otras variables. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 85 Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de HANA C 4.5 Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. ● Relleno: rellena los valores faltantes en la columna de destino. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Variable de destino Seleccione la columna de destino para la que desea realizar el análisis. Nota Solo acepta columnas con el tipo de datos enteros. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Porcentaje de datos de entrada Introduzca el porcentaje de datos que desee considerar para el análisis. División mínima Introduzca el número de registros a partir del cual no se permite la división del nodo de hojas. El valor predeterminado es 0. Columnas Seleccione las columnas independientes que contengan los valores numéricos. Rangos de agrupamiento Introduzca los rangos de agrupamiento. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene el valor previsto. 86 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. 15.1.4.2 Árbol HANA R-CNR Sintaxis Use este algoritmo para clasificar las observaciones en grupos y predecir una o varias variables discretas según otras variables. Sin embargo, puede utilizar este algoritmo para encontrar tendencias en los datos. Nota ● El paquete "rpart" que forma parte de R 2.15 no puede tratar los nombres de columnas que contienen espacios o caracteres especiales. El paquete "rpart" solo es compatible con el formato del nombre de la columna de entrada compatible con el marco de datos R. ● Los nombres de la columna independiente que se usen al puntuar el modelo deben ser los mismos que los nombres de la columna independiente que se usó al crear el modelo. ● No se admiten los nombres de columnas que contienen espacios y otros caracteres especiales diferentes al punto (.) Propiedades del árbol HANA R-CNR Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. ● Relleno: rellena los valores faltantes en la columna de destino. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Variable de destino Seleccione la columna de destino para la que desea realizar el análisis. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: El algoritmo omite los registros que contienen valores perdidos en la columna independiente o la columna dependiente. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 87 Tipo de algoritmo: Seleccione el tipo de análisis que desee que ejecute el algoritmo. Valores posibles: ● Clasificación: utilice este método si la variable dependiente tiene valores categóricos. ● Regresión: utilice este método si la variable dependiente tiene valores numéricos. División mínima Introduzca el número mínimo de observaciones necesarios para dividir un nodo. El valor predeterminado es 10. Dividir criterios Seleccione el criterio de división del nodo. Valores posibles: ● Gini: impurezas gini. ● Información: ganancia de información Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Parámetro de complejidad Introduzca el parámetro de complejidad que guarda el tipo de cálculo al evitar las divisiones que no mejoran el ajuste. El valor predeterminado es 0,005. Profundidad máxima Introduzca el nivel de nodo máximo en el árbol final con el nodo de raíz contado como nivel 0. Nota Si la profundidad máxima es mayor de 30, el algoritmo no producirá los resultados esperados (en máquinas de 32 bits). Validación cruzada Introduzca el número de validaciones cruzadas. Un valor de validación cruzada mayor incrementará el tiempo de computación y producirá resultados más precisos. Probabilidad anterior Introduzca el vector de probabilidades anteriores. Usar subrogado Seleccione el subrogado que se usará en el proceso de división. Valores posibles: ● Mostrar solo - una observación con un valor faltante en la regla de división primaria no se reproducirá en el árbol. ● Usar subrogado: utilice esta opción para dividir sujetos faltantes en la variable primaria. Si faltan todos los subrogados, la observación no se dividirá. ● Detener si falta: si faltan todos los subrogados, se enviará una observación en la dirección de la mayoría. Estilo del subrogado 88 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Introduzca el estilo que controla la selección del mejor subrogado. Valores posibles: ● Usar clasificación correcta total: el algoritmo usa el número total de clasificaciones correctas para encontrar una posible variable subrogada. ● Usar porcentaje de casos no faltantes: el algoritmo usa el porcentaje de casos no faltantes clasificados para encontrar un posible subrogado. Subrogado máximo Introduzca el número máximo de subrogados que se deben conservar en cada nodo de un árbol. Mostrar probabilidad Seleccione la casilla de verificación Mostrar probabilidad para obtener la probabilidad de los valores previstos durante el cálculo de un modelo de clasificación. 15.1.4.3 CHAID HANA Sintaxis CHAID representa la detección de la interacción automática de Chi al cuadrado. Es un método de clasificación para crear árboles de decisiones mediante estadísticas de Chi al cuadrado para identificar las divisiones óptimas. Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo. Propiedades de CHAID HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. ● Relleno: rellena los valores faltantes en la columna de destino. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Variable de destino Seleccione la columna de destino para la que desea realizar el análisis. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 89 Nota Solo acepta columnas con el tipo de datos enteros. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Porcentaje de datos de entrada Introduzca el porcentaje de datos que se tendrán en cuenta para el análisis. División mínima Introduzca el número mínimo de registros para un nodo, más allá del cual no se permite la división ese nodo concreto. El valor predeterminado es 0. Profundidad máxima Introduzca la profundidad máxima del árbol. Nombre de columna Seleccione el nombre de la columna independiente que contiene los valores numéricos. Introducir rangos de agrupamiento Introduzca los rangos de agrupamiento. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores previstos. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. 15.1.4.4 Árbol CNR R Sintaxis Use este algoritmo para clasificar las observaciones en grupos y predecir una o varias variables discretas según otras variables. Sin embargo, puede utilizar este algoritmo para encontrar tendencias en los datos. Nota 90 ● El paquete "rpart" que forma parte de R 2.15 no puede tratar los nombres de columnas que contienen espacios o caracteres especiales. El paquete "rpart" solo es compatible con el formato del nombre de la columna de entrada compatible con el marco de datos R. ● Los nombres de la columna independiente que se usen al puntuar el modelo deben ser los mismos que los nombres de la columna independiente que se usó al crear el modelo. ● No se admiten los nombres de columnas que contienen espacios y otros caracteres especiales diferentes al punto (.) © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Propiedades del árbol R-CNR Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. ● Relleno: rellena los valores faltantes en la columna de destino. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Variable de destino Seleccione la columna de destino para la que desea realizar el análisis. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Rpart: el algoritmo elimina todas las observaciones que le faltan a la columna dependiente. Sin embargo, retiene estas observaciones en aquellas columnas independientes que falten. ● Omitir: El algoritmo omite los registros que contienen valores perdidos en la columna independiente o la columna dependiente. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. ● Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente. Tipo de algoritmo: Seleccione el tipo de análisis que desee que ejecute el algoritmo. Valores posibles: ● Clasificación: utilice este método si la variable dependiente tiene valores categóricos. ● Regresión: utilice este método si la variable dependiente tiene valores numéricos. División mínima Introduzca el número mínimo de observaciones necesarios para dividir un nodo. El valor predeterminado es 10. Dividir criterios Seleccione el criterio de división del nodo. Valores posibles: ● Gini: impurezas gini. ● Información: ganancia de información Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Parámetro de complejidad Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 91 Introduzca el parámetro de complejidad que guarda el tipo de cálculo al evitar las divisiones que no mejoran el ajuste. El valor predeterminado es 0,005. Profundidad máxima Introduzca el nivel de nodo máximo en el árbol final con el nodo de raíz contado como nivel 0. Nota Si la profundidad máxima es mayor de 30, el algoritmo no producirá los resultados esperados (en máquinas de 32 bits). Validación cruzada Introduzca el número de validaciones cruzadas. Un valor de validación cruzada mayor incrementará el tiempo de computación y producirá resultados más precisos. Probabilidad anterior Introduzca el vector de probabilidades anteriores. Usar subrogado Seleccione el subrogado que se usará en el proceso de división. Valores posibles: ● Mostrar solo - una observación con un valor faltante en la regla de división primaria no se reproducirá en el árbol. ● Usar subrogado: utilice esta opción para dividir sujetos faltantes en la variable primaria. Si faltan todos los subrogados, la observación no se dividirá. ● Detener si falta: si faltan todos los subrogados, el algoritmo enviará una observación en la dirección de la mayoría. Estilo del subrogado Introduzca el estilo que controla la selección del mejor subrogado. Valores posibles: ● Usar clasificación correcta total: el algoritmo usa el número total de clasificaciones correctas para encontrar una posible variable subrogada. ● Usar porcentaje de casos no faltantes: el algoritmo usa el porcentaje de casos no faltantes clasificados para encontrar un posible subrogado. Subrogado máximo Introduzca el número máximo de subrogados que se deben conservar en cada nodo de un árbol. Mostrar probabilidad Seleccione la casilla de verificación Mostrar probabilidad para obtener la probabilidad de los valores previstos durante el cálculo de un modelo de clasificación. 92 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 15.1.5 Red neural 15.1.5.1 Red neuronal MONMLP R Sintaxis Use este algoritmo para pronosticar, clasificar y reconocer los patrones estadísticos mediante las funciones de la biblioteca R. Nota R no admite el almacenamiento PMML para la red neuronal MONMLP. Propiedades de la red neuronal MONMLP R Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. ● Relleno: rellena los valores faltantes en la columna de destino. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Variable de destino Seleccione la columna de destino para la que desea realizar el análisis. Neuronas de capa 1 oculta Introduzca el número de nodos/neuronas de la primera capa oculta (hidden1). El valor predeterminado es 5. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Función de transferencia de capa oculta Seleccione la función de activación que se va a usar para la capa oculta (Th). Función de transferencia de capa de salida Seleccione la función de activación que se va a usar para la capa de salida (To). Derivada de la función de transferencia de capa oculta Seleccione la derivada de la función de activación de la capa oculta (Th.prime). Derivada de la función de transferencia de capa de salida Seleccione la derivada de la función de activación de la capa de salida (To.prime). Neuronas de capa 2 oculta Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 93 Introduzca el número de nodos/neuronas de la segunda capa oculta (hidden2). El valor predeterminado es 0. Repeticiones máximas Introduzca el número máximo de repeticiones para el algoritmo de optimización (iter.max). El valor predeterminado es 5000. Columnas monótonas Introduzca los índices de columna a los que desea aplicar la limitación de tono único (monotone). Repeticiones de formación Introduzca el número de repeticiones de formación tras las que se detendrá el cálculo de la función de costes (iter.stopped). Pesos iniciales Introduzca un vector de peso inicial (init.weights). Excepciones máximas Introduzca el número máximo de excepciones para la rutina de optimización (max.exceptions). Escalar columna dependiente Para escalar las columnas dependientes a la media cero y la varianza de unidad antes del ajuste, seleccione Verdadero (scale.y). Empaquetado necesario Seleccione True para usar la agregación de arranque (bag). Intentos para evitar mínimo local Introduzca el número de intentos repetidos para evitar el mínimo local (n.trials). Número de miembros del conjunto Introduzca el número de miembros del conjunto para ajustar (n.ensemble). 15.1.5.2 Red neuronal NNet R Sintaxis Use este algoritmo para pronosticar, clasificar y reconocer los patrones estadísticos mediante las funciones de la biblioteca R. Propiedades de la red neuronal R-NNet Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Valores posibles: 94 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes ● Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos. ● Relleno: rellena los valores faltantes en la columna de destino. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Variable de destino Seleccione la columna de destino para la que desea realizar el análisis. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: El algoritmo conserva valores faltantes. ● Detener: el algoritmo se detiene si falta un valor en la columna independiente o en la columna dependiente. Neuronas de capa oculta Introduzca el número de neuronas/nodos en la capa oculta. El valor predeterminado es 5. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Tipo de algoritmo: Seleccione el tipo de análisis que desee que ejecute el algoritmo. Omitir capa oculta Para agregar conexiones de capa de omisión desde la entrada a la salida (skip), seleccione True. Salida lineal Para obtener una salida lineal (linout), seleccione True. Si selecciona el tipo de análisis de Clasificación, este valor debe establecerse en True. Usar Softmax Seleccione True para usar los ajustes "modelos de registro lineal" y "probabilidad condicional máxima" . Las opciones salida lineal (linout), entropía, softmax y censurado se excluyen entre sí. Usar entropía Para usar el ajuste "probabilidad condicional máxima", seleccione True. De forma predeterminada, el algoritmo usa el método de mínimos cuadrados. Valores posibles: ● True: use el ajuste "modelos de registro lineal" ● False: use el método de mínimos cuadrados Usar censurado Para softmax, una fila de (0,1,1) indica un ejemplo de cada clase 2 y 3, pero para censurado indica un ejemplo de cada clase 2 o 3. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 95 Rango Introduzca el rango inicial de pesos aleatorios [-rang, rang]. Establezca este valor en 0,5 a menos que la entrada sea grande. Si la entrada de datos es grande, elija el intervalo mediante la fórmula: rang * max(|x|) <= 1 Caída de peso Introduzca un valor para calcular pesos nuevos (caída de peso). Repeticiones máximas Introduzca el número máximo de repeticiones permitidas. Matriz Hessian necesaria Para devolver al indicador Hessian al mejor conjunto de pesos, seleccione True. Pesos máximos Introduzca el número máximo de pesos permitidos en el cálculo. No hay ningún límite intrínseco en el código, pero incrementar el número máximo de pesos puede resultar en un funcionamiento más lento y mayor consumo de tiempo. Abstol Introduzca el valor que indica el ajuste perfecto (abstol). Reltol El algoritmo finaliza si el optimizador no puede reducir los criterios de ajuste por un factor: 1 - reltol Contrastes Introduzca la lista de contrastes que se va a usar para factores que aparezcan como variables en el modelo. 15.1.6 Agrupación en clúster 15.1.6.1 Medios K de HANA Sintaxis Use este algoritmo para almacenar en clúster las observaciones en grupos de observaciones relacionadas sin conocimiento previo de dichas relaciones. El algoritmo agrupa en clúster las observaciones en grupos k, donde k se proporciona como un parámetro de entrada. A continuación, el algoritmo asigna cada observación a los clústeres según la proximidad de la observación al medio del clúster. El proceso continúa hasta que los clústeres convergen. Nota 96 ● Es posible que obtenga un número de clústeres distinto para cada clúster cada vez que ejecute el algoritmo de medios K de HANA. Sin embargo, las observaciones de cada clúster siguen siendo las mismas. ● No se admite la creación de modelos mediante el algoritmo de medios K de HANA. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Propiedades de los medios K de HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo omite el registro que contiene los valores faltantes durante el cálculo. Número de clústeres Introduzca el número de grupos para la agrupación en clúster. El valor predeterminado es 5. Nombre de clúster Introduzca un nombre para la columna recién creada que contiene el nombre del clúster. Distancia Introduzca el nombre de la columna recién creada que contiene la distancia de los clústeres del nombre de centroids. Repeticiones máximas Introduzca el número de repeticiones permitidas para buscar clústeres. El valor predeterminado es 100. Método de cálculo central Seleccione el método que se usará para calcular los centros del clúster inicial. Medición de distancia Introduzca el método para calcular la distancia entre el elemento y el centro del clúster. Tipo de normalización Seleccione el tipo de normalización. Número de subprocesos Introduzca el número de subprocesos que se pueden usar para la ejecución. El valor predeterminado es 1. Umbral de salida Introduzca el valor de umbral para salir de las repeticiones. El valor predeterminado es 0,000000001. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 97 15.1.6.2 Medios R-K de HANA Sintaxis Use este algoritmo para almacenar en clúster las observaciones en grupos de observaciones relacionadas sin conocimiento previo de dichas relaciones. El algoritmo agrupa en clúster las observaciones en grupos k, donde k se proporciona como un parámetro de entrada. A continuación, el algoritmo asigna cada observación a los clústeres según la proximidad de la observación al medio del clúster. El proceso continúa hasta que los clústeres convergen. Nota ● Es posible que obtenga un número de clústeres distinto para cada clúster cada vez que ejecute el algoritmo R-K-Means. Sin embargo, las observaciones de cada clúster siguen siendo las mismas. ● No se admite la creación de modelos mediante el algoritmo de medios R-K de HANA. Propiedades de medios R-K HANA Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Número de clústeres Introduzca el número de grupos para la agrupación en clúster. El valor predeterminado es 5. Nombre de clúster Introduzca un nombre para la columna recién creada que contiene números de clúster. Repeticiones máximas Introduzca el número de repeticiones permitidas para buscar clústeres. El valor predeterminado es 100. Número de conjuntos Centroid iniciales Introduzca el número de conjuntos iniciales centroid para la agrupación en clúster (inicio n). El valor predeterminado es 1. Tipo de algoritmo: Seleccione el tipo de algoritmo que se usará para realizar la agrupación en clúster de medios K. 98 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 15.1.6.3 R-K-Means Sintaxis Use este algoritmo para almacenar en clúster las observaciones en grupos de observaciones relacionadas sin conocimiento previo de dichas relaciones. El algoritmo agrupa en clúster las observaciones en grupos k, donde k se proporciona como un parámetro de entrada. A continuación, el algoritmo asigna cada observación a los clústeres según la proximidad de la observación al medio del clúster. El proceso continúa hasta que los clústeres convergen. Nota ● Es posible que obtenga un número de clústeres distinto para cada clúster cada vez que ejecute el algoritmo R-K-Means. Sin embargo, las observaciones de cada clúster siguen siendo las mismas. ● No se admite la creación de modelos mediante el algoritmo R-K-Means. Propiedades de R-K-Means Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Número de clústeres Introduzca el número de grupos para la agrupación en clúster. Nombre de clúster Introduzca un nombre para la columna recién creada que contiene el nombre del clúster. Repeticiones máximas Introduzca el número de repeticiones permitidas para buscar clústeres. El valor predeterminado es 100. Número de conjuntos Centroid iniciales Introduzca el número de conjuntos iniciales de centroids para la agrupación en clúster (inicio n). El valor predeterminado es 1. Algoritmo Seleccione el tipo de algoritmo que se usará para realizar la agrupación en clúster de medios K. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 99 15.1.6.4 Mapas de organización propia de HANA Sintaxis Un mapa de organización propia (SOM) o un mapa de función de organización propia (SOFM) es un tipo de red neuronal artificial formada con aprendizaje no supervisado para producir una representación discretizada de bajas dimensiones (normalmente de dos dimensiones) del espacio de entrada de las muestras de formación, denominado mapa. Estos mapas de organización propia se diferencian de otras redes neuronales en que utilizan una función de vecindario para conservar las propiedades topológicas del espacio de entrada. Por este motivo, los SOMs resultan útiles para las vistas de pocas dimensiones de datos de muchas dimensiones, de forma similar a la escala multidimensional. El profesor finlandés Teuvo Kohonen fue el primero en describir este modelo como una red neuronal artificial y en ocasiones se denomina mapa Kohonen. Al igual que la mayoría de redes neuronales artificiales, los SOMs funcionan en dos modos: formación y creación de mapas. La formación crea el mapa con ejemplos de entrada, un proceso competitivo que también se denomina cuantificación de vectores. La creación de mapas clasifica automáticamente un nuevo vector de entrada. El alcance de los SOM tiene diversas aplicaciones, como la virtualización, la agrupación en clúster de documentos web y el reconocimiento por voz. Propiedades de los mapas de organización propia de HANA Altura del mapa Introduzca una altura para el mapa. El valor predeterminado es 5. Anchura del mapa Introduzca una anchura para el mapa. El valor predeterminado es 5. Alfa Introduzca el valor para la tasa de aprendizaje. El valor predeterminado es 0,5. Forma del mapa Seleccione la forma para el mapa. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Nombre de clúster Introduzca un nombre para la nueva columna que contiene los números de clúster para un conjunto de datos determinado. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: 100 ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva el registro que contiene los valores faltantes durante el cálculo. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Tipo de normalización Seleccione el tipo de normalización. Tipos posibles: ● No es necesaria la normalización ● Nueva normalización de rangos ● Normalización del resultado cero: Muestreo aleatorio Introduzca el muestreo aleatorio que desee utilizar para realizar el cálculo. Si introduce -1, el algoritmo selecciona por sí solo un número aleatorio para el cálculo. El valor predeterminado es -1. Repeticiones máximas Introduzca la cantidad de repeticiones que desea que el algoritmo utilice para buscar clústeres. El valor predeterminado es 100. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 2. 15.1.7 Asociación 15.1.7.1 Apriori de HANA Sintaxis Use este algoritmo para localizar patrones frecuentes de conjuntos de elementos en grandes conjuntos de datos transaccionales para generar reglas de asociaciones. Este algoritmo sirve para averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Al analizar las tendencias de compra de los clientes con los análisis de asociaciones, puede prever su comportamiento en un futuro. Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines [compatibilidad = 0,5, confianza= 0,1] Nota No se admite la creación de modelos mediante el algoritmo Apriori de HANA. Propiedades de Apriori de HANA Tipo a priori Seleccione Apriori. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 101 Columna de elementos Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo.. Columna de ID de transacción Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los valores faltantes para su procesamiento. Compatibilidad Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1. Confianza Introduzca un valor para la confianza mínima de reglas/asociación. El valor predeterminado es 0,8. Recuento máximo de elementos Introduzca la longitud de los elementos iniciales y de los elementos dependientes de la salida. El valor predeterminado es 5. Número de subprocesos Escriba el número de hilos que el algoritmo debe ejecutar. El valor predeterminado es 1. 15.1.7.2 HANA Apriori Lite Sintaxis Use este algoritmo para buscar patrones frecuentes de conjuntos de elementos en conjuntos de datos transaccionales grandes para generar reglas de asociación. Apriori Lite también admite el muestreo dentro del algoritmo. Nota ● Puede usar HANA Apriori Lite desde las propiedades del algoritmo de HANA Apriori al seleccionar AprioriLite como el Tipo Apriori. ● No se admite la creación de modelos mediante el algoritmo AprioriLite de HANA. ● Solo calcula dos conjuntos de elementos de gran tamaño. 102 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Propiedades de AprioriLite de HANA Tipo a priori Haga clic en AprioriLite. Columna de elementos Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo.. Columna de ID de transacción Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: el algoritmo conserva los valores faltantes para su procesamiento. Compatibilidad Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1. Confianza Introduzca un valor para la confianza mínima de reglas/asociación. El valor predeterminado es 0,8. Ejemplo obligatorio Seleccione esta opción si desea ejemplificar los datos. Ejemplificación de porcentaje Introduzca el porcentaje de ejemplificación. Recálculo obligatorio Seleccione esta opción si desea recalcular el soporte y la confianza de cada iteración. Número de subprocesos Introduzca el número de subprocesos que se usarán para la ejecución. 15.1.7.3 HANA R Apriori Sintaxis Utilice este algoritmo para encontrar patrones en los conjuntos de elementos frecuentes en conjuntos de datos grandes para generar reglas de asociación mediante el paquete de R "arules". Este algoritmo sirve para averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Si se analizan las tendencias de compra de los clientes con un análisis de asociación, se puede realizar una predicción de sus comportamientos en el futuro. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 103 Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines [compatibilidad = 0,5, confianza= 0,1] Propiedades de HANA R Apriori Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Formato de entrada Seleccione el formato de los datos de entrada. Columnas de elementos Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo.. Columna de ID de transacción Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo. Compatibilidad Introduzca un valor para el soporte mínimo de un elemento. Confianza Introduzca un valor para la confianza mínima de reglas/asociación. Reglas Introduzca un nombre para la nueva columna que contiene las reglas a priori para un conjunto de datos determinado. Valores compatibles Introduzca un nombre para la nueva columna que contiene la compatibilidad para las reglas correspondientes. Valores de confianza Introduzca un nombre para la columna nueva que contiene los valores de confianza de las reglas correspondientes. Valores de elevación Introduzca un nombre para la nueva columna que contiene los valores de elevación para las reglas correspondientes. ID de transacción Introduzca un nombre para la nueva columna que contiene la ID de transacción. Elementos Introduzca un nombre para la nueva columna que contiene los nombres de los elementos. Reglas coincidentes Introduzca un nombre para la nueva columna que contiene las reglas coincidentes. Elemento(s) Lhs 104 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a la izquierda de las reglas o de los conjuntos de elementos. Elemento(s) Rhs Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a la derecha de las reglas o de los conjuntos de elementos. Ambos elementos Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a ambos lados de las reglas o de los conjuntos de elementos. Ningún elemento(s) Introduzca etiquetas separadas por comas que indiquen los elementos que no deben aparecer en las reglas o en los conjuntos de elementos. Apariencia predeterminada Introduzca la apariencia predeterminada de los elementos que no se mencionen específicamente. Tipo de ordenación: Seleccione la opción de ordenación para ordenar los elementos atendiendo a su frecuencia. Criterios de filtro Introduzca un valor numérico que indique el modo de filtrar los elementos sin usar de las transacciones. El valor predeterminado es 0,1. Usar estructura de árbol Para organizar transacciones según un árbol de prefijos, seleccione True. Usar ordenación por montículos Para usar la ordenación por montículos en lugar de la ordenación rápida para ordenar las transacciones, seleccione True. Optimizar memoria Para minimizar el uso de memoria en lugar de maximizar la velocidad, seleccione True. Cargar transacciones a la memoria Para cargar las transacciones en la memoria, seleccione True. 15.1.7.4 Apriori R Sintaxis Utilice este algoritmo para encontrar patrones en los conjuntos de elementos frecuentes en conjuntos de datos grandes para generar reglas de asociación mediante el paquete de R "arules". Este algoritmo sirve para averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Si se analizan las tendencias de compra de los clientes con un análisis de asociación, se puede realizar una predicción de sus comportamientos en el futuro. Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 105 mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines [compatibilidad = 0,5, confianza= 0,1] Propiedades de R-Apriori Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Formato de entrada Seleccione el formato de los datos de entrada. Columnas de elementos Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo.. Columna de ID de transacción Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo. Compatibilidad Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1. Confianza Introduzca un valor para la confianza mínima de reglas/asociación. El valor predeterminado es 0,8. Reglas Introduzca un nombre para la nueva columna que contiene las reglas a priori para un conjunto de datos determinado. Valores compatibles Introduzca un nombre para la nueva columna que contiene la compatibilidad para las reglas correspondientes. Valores de confianza Introduzca un nombre para la columna nueva que contiene los valores de confianza de las reglas correspondientes. Valores de elevación Introduzca un nombre para la nueva columna que contiene los valores de elevación para las reglas correspondientes. ID de transacción Introduzca un nombre para la nueva columna que contiene la ID de transacción. Elementos Introduzca un nombre para la nueva columna que contiene los nombres de los elementos. Reglas coincidentes Introduzca un nombre para la nueva columna que contiene las reglas coincidentes. Elemento(s) Lhs 106 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a la izquierda de las reglas o de los conjuntos de elementos. Elemento(s) Rhs Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a la derecha de las reglas o de los conjuntos de elementos. Ambos elementos Introduzca etiquetas separadas por comas para los elementos que deberían aparecer a ambos lados de las reglas o de los conjuntos de elementos. Ningún elemento(s) Introduzca etiquetas separadas por comas que indiquen los elementos que no deben aparecer en las reglas o en los conjuntos de elementos. Apariencia predeterminada Introduzca la apariencia predeterminada de los elementos que no se mencionen específicamente. Tipo de ordenación: Seleccione la opción de ordenación para ordenar los elementos por frecuencia. Criterios de filtro Introduzca un valor numérico que indique el modo de filtrar los elementos sin usar de las transacciones. El valor predeterminado es 0,1. Usar estructura de árbol Para organizar transacciones según un árbol de prefijos, seleccione True. Usar ordenación por montículos Para usar la ordenación por montículos en lugar de la ordenación rápida para ordenar las transacciones, seleccione True. Optimizar memoria Para minimizar el uso de memoria en lugar de maximizar la velocidad, seleccione True. Cargar la transacción a la memoria Para cargar las transacciones en la memoria, seleccione True. 15.1.8 Clasificación 15.1.8.1 KNN HANA Sintaxis Use este componente para clasificar objetos según los datos de ejemplo formados. En KNN, los objetos se clasifican por la mayoría de votos de sus vecinos. Nota No se admite la creación de modelos mediante el algoritmo KNN de HANA. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 107 Propiedades de KNN de HANA Características Seleccione las columnas de entrada con las que desea realizar el análisis Recuento de vecinos Introduzca el número de vecinos a tener en cuenta para buscar distancias. El valor predeterminado es 5. Tipo de voto Seleccione el tipo de voto para el cálculo de la cuenta de vecino. Valores faltantes Seleccione el método para manejar los valores perdidos. ● Omitir: El algoritmo omite los registros que contienen valores faltantes en las características o variables meta. ● Conservar: El algoritmo conserva los valores faltantes. Nombre de esquema Introduzca el nombre de esquema que contiene los datos formados. Nombre de tabla Introduzca el nombre de la tabla que contiene los datos formados. Columnas independientes Introduzca las columnas de entrada que desea tener en cuenta para formar los datos. Columna dependiente Introduzca las columnas de salida que desea tener en cuenta para formar los datos. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores de clasificación. Número de subprocesos Escriba el número de subprocesos que desea que el algoritmo ejecute. El valor predeterminado es 1. 15.1.8.2 Análisis ABC de HANA Sintaxis Use este algoritmo para clasificar objetos (como clientes, empleados o productos) basándose en un indicador específico (como volumen de negocios o beneficio). Sugiere que los inventarios de una organización no son del mismo valor. Además, los inventarios pueden agruparse en tres categorías (A, B y C) según su importancia estimada. Los elementos "A" son muy importantes para una ogranización. Los elementos "B" tienen una importancia media, es decir, son menos importantes que los elementos "A" pero más que los "C". Los elementos "C" son los de menor importancia. Un ejemplo de clasificación ABC sería: 108 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes ● Elementos A: 20% de las cuentas de elementos para el 70% del valor de consumo anual de todos los elementos. ● Elementos B: 30% de las cuentas de elementos para el 25% del valor de consumo anual de todos los elementos. ● Elementos C: 50% de las cuentas de elementos para el 5% del valor de consumo anual de todos los elementos. Propiedades de Análisis ABC de HANA Características Seleccione las columnas de entrada con las que desea realizar la regresión. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: El algoritmo omite los registros que contienen valores faltantes en las características o variables meta. ● Conservar: el algoritmo conserva el registro que contiene los valores faltantes durante el cálculo. Desglose de porcentaje de A Introduzca el porcentaje de elementos que desee clasificar en el grupo A. El valor por defecto es 40. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%. Desglose de porcentaje de B Introduzca el porcentaje de elementos que desee clasificar en el grupo B. El valor por defecto es 30. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%. Desglose de porcentaje de C Introduzca el porcentaje de elementos que desee clasificar en el grupo C. El valor por defecto es 30. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 30. Nombre de columna prevista Introduzca un nombre para la columna recién añadida que contiene los valores previstos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 109 15.1.8.3 Análisis de puntuaciones ponderadas de HANA Sintaxis Una tabla de puntuaciones ponderadas es un método para evaluar alternativas cuando la importancia de los criterios es diferente. En una tabla de puntuaciones ponderadas, cada alternativa recibe una puntuación para cada criterio. Estas puntuaciones se ponderan por la importancia de cada criterio. Todas las puntuaciones ponderadas de una alternativa se suman para calcular la puntuación ponderada total. La alternativa con la puntuación total más alta sería la mejor alternativa. Puede utilizar tablas de puntuaciones ponderadas para predecir el comportamiento futuro de los clientes. Cree un modelo basado en datos históricos en la aplicación de minería de datos y aplique el modelo a los nuevos datos para realizar la predicción. Esta predicción (el resultado del modelo), se denomina puntuación. Puede crear una sola puntuación para sus clientes teniendo en cuenta diferentes dimensiones. Una función definida por tablas de puntuaciones ponderadas es una combinación lineal de funciones de una variable. f(x1,…,xn) = w1× f 1(x1) + … + wn× f n(xn) Análisis de puntuaciones ponderadas de HANA Característica Seleccione la columna de entrada con la que desea realizar el análisis. Tipo Seleccione el tipo "Discreta" si la columna tiene datos categóricos o "Continua" si los datos son numéricos. Pesos Introduzca las ponderaciones para la columna seleccionada. El valor predeterminado es 0,0. Clave y puntuación Introduzca los valores para las claves y puntuaciones. Valores faltantes Seleccione el método para manejar los valores perdidos. ● Omitir: El algoritmo omite los registros que contienen valores faltantes en las características o variables meta. ● Conservar: El algoritmo conserva valores faltantes. Número de subprocesos Escriba el número de hilos que el algoritmo debe ejecutar. El valor predeterminado es 1. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores previstos. 110 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 15.1.8.4 HANA Naive Bayes Sintaxis Naive Bayes es un algoritmo de clasificación basado en el teorema de Bayes. Estima la probabilidad condicional de clase asumiendo que los atributos son condicionalmente independientes uno de otro. A pesar de su simplicidad, Naive Bayes funciona bastante bien en áreas como la colasificación de documentos y y filtrado de spam, y solo requiere una pequeña cantidad de datos de formación para estimar los parámetros necesarios para la clasificación. Propiedades de HANA Naive Bayes Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo. Características Seleccione las columnas de entrada con las que desea realizar la regresión. Variable de destino Seleccione la columna de destino para la que desea realizar el análisis. Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos. Suavizado de Laplace Introduzca la constante de suavizado para las observaciones de suavizado. La constante de suavizado debe ser un valor doble superior a 0. Introduzca 0 para deshabilitar el suavizado de Laplace. Valores faltantes Seleccione el método para manejar los valores perdidos. ● Omitir: El algoritmo omite los registros que contienen valores faltantes en las características o variables meta. ● Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. 15.2 Componentes de preparación de datos Use los componentes de preparación de datos para preparar los datos para el análisis. Estos componentes son opcionales. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 111 15.2.1 Fórmula Sintaxis Utilice este componente para aplicar funciones y operadores predefinidos en los datos. Todas las funciones y expresiones, excepto las funciones de manipulación de datos, añaden una nueva columna con el resultado de la fórmula. Nota Cuando se introduce una cadena literal que contiene comillas simples, cada comilla de la cadena literal debe ir precedida con un carácter de barra inversa (\). Por ejemplo, si desea escribir la palabra "Customer's", deberá escribir "Customer\'s". Nota Cuando se introduce un nombre de columna que contiene corchetes, cada corchete en el interior del nombre de la columna debe ir precedido con un carácter de barra inversa (\). Por ejemplo, si desea escribir [Cliente[Edad]], deberá escribir [Cliente\[Edad\]]. Propiedades de las fórmulas Nombre de fórmula Introduzca un nombre para la nueva columna creada mediante la aplicación de una fórmula. Expresión Escriba la fórmula que desea aplicar. Por ejemplo, Promedio([Edad]). Ejemplo Calcula el promedio de edad de los empleados Tabla de empleados: ID del empleado Nombre del empleado Fecha de nacimiento Edad Fecha de incorporación Fecha de confirmación 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 2 Desi 12/5/1981 30 24/6/2000 10/7/2000 3 Álex 30/5/1978 33 10/10/1998 24/12/1998 4 Juan 6/6/1979 32 2/12/1999 20/12/1999 Para calcular el promedio de edad de los empleados, realice los siguientes pasos: 1. Arrastre el componente Fórmula al editor de análisis. 2. En la vista Propiedades, introduzca un nombre para la fórmula. Por ejemplo, Promedio_Edad. 112 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 3. En el campo Expresión, introduzca la fórmula: PROMEDIO([Edad]) 4. Seleccione Validar para validar la sintaxis de la fórmula. 5. Seleccione Fin. Tabla de salida: ID del empleado Nombre del empleado Fecha de nacimiento Edad Fecha de incorporació n Fecha de Promedio_Ed confirmación ad 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 30 2 Desi 12/5/1981 30 24/6/2000 10/7/2000 30 3 Álex 30/5/1978 33 10/10/1998 24/12/1998 30 4 Juan 6/6/1979 32 2/12/1999 20/12/1999 30 Funciones admitidas Categoría Función (Función cuando se aplica Descripción a la tabla Empleado) Fecha DÍASENTRE Devuelve el número de días entre dos fechas. FECHAACTUAL Devuelve la fecha actual del sistema. MESESENTRE Devuelve el número de meses entre dos fechas. Por ejemplo, la nueva columna contiene 2,0,2,0 cuando se aplica MESESENTRE([Fecha de incorporación],[Fecha de confirmación]) a la tabla Empleado. NOMBREDELDÍA Devuelve el nombre del día en formato de cadena. Por ejemplo, la nueva columna contendrá lunes, sábado, sábado, jueves cuando se aplique NOMBREDELDÍA([Fecha de incorporación]) a la tabla Empleado. NÚMERODEDÍADELMES Devuelve el número del día de un mes determinado. Por ejemplo, la fecha 12/11/1980 devuelve el número 12. NÚMERODEDÍADELASEMANA Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Devuelve el número de día de una semana. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 113 Categoría Función (Función cuando se aplica Descripción a la tabla Empleado) Por ejemplo, domingo=1, lunes=2. NÚMERODEDÍADELAÑO Devuelve el número de día de un año. Por ejemplo, el 1 de enero=1, 1 de febrero=32, 3 de febrero=34. ÚLTIMODÍADELASEMANA Devuelve la fecha del último día de la semana. Por ejemplo, la fecha 12/9/2005 devuelve 17/9/2005 ÚLTIMODÍADELMES Devuelve la fecha del último día del mes. Por ejemplo, la fecha 12/9/2005 devuelve 30/9/2005 NÚMERODEMESDELAÑO Devuelve el número del mes en una fecha. Por ejemplo, enero=1, febrero=2, marzo=3. NÚMERODESEMANADELAÑO Devuelve el número de semana en un año. Por ejemplo, 12/9/2005 devuelve 38. NÚMERODETRIMESTREDELAFECHA Devuelve el número del trimestre en una fecha. Por ejemplo, 12/9/2005 devuelve 3. Cadena CONCAT Concatena dos cadenas. Por ejemplo, la expresión CONCAT('EE.UU.','Australia') devuelve EE.UU.Australia. ENLACADENA Devuelve el resultado True si se encuentra la cadena buscada en la cadena fuente. Por ejemplo, la expresión ENLACADENA('EE.UU.','EU') devuelve el resultado True. SUBCADENA Devuelve una subcadena de una cadena fuente. Por ejemplo, la expresión SUBCADENA('EE.UU.',1,2) devuelve EE. LONGCAD 114 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Devuelve el número de caracteres que contiene la cadena fuente. Por ejemplo, la expresión LONGCAD('Australia') devuelve 9. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Categoría Función (Función cuando se aplica Descripción a la tabla Empleado) Matemáticas MAX Devuelve el valor máximo de una columna. MIN Devuelve el valor mínimo de una columna. CONTAR Devuelve el número de valores de una columna. SUMA Devuelve la suma de los valores de una columna. PROMEDIO Devuelve el promedio de los valores de una columna. @REEMPLAZAR Realiza un reemplazo in situ de una cadena. Manipulación de datos Por ejemplo, @REEMPLAZAR([país], 'EE.UU.','NORTEAMÉRICA') reemplazará la palabra EE.UU. por NORTEAMÉRICA en la columna de país. @ENBLANCO Reemplaza los valores en blanco con un valor específico. Por ejemplo, @ENBLANCO([país],'EE.UU.') sustituye todos los valores en blanco por la cadena EE.UU. en la columna de país. @SELECT Selecciona las filas que cumplen una condición determinada. Puede utilizar cualquier operador condicional para especificar la condición. Por ejemplo, @SELECT([país]=='EE.UU.') selecciona las filas en las que el país sea igual a EE.UU. Expresión condicional IF(condición) THEN(expresión de cadena/expresión matemática/ expresión condicional) ELSE(expresión de cadena/expresión matemática/ expresión condicional) Comprueba si se cumple la condición y devuelve un valor si se cumple ("true") y otro si no se cumple ("false"). Por ejemplo, IF([Fecha de incorporación]>12/9/2005) THEN ('Empleado incorporado después del 12 de septiembre de 2005') ELSE ('Empleado incorporado el o antes del 12 de septiembre de 2005') Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 115 Nota Las expresiones matemáticas que contienen funciones que devuelve un valor numérico no son compatibles. Por ejemplo, la expresión NÚMERODEDÍADELMES(FECHAACTUAL())+2 no es compatible porque NÚMERODEDÍADELMES devuelve un valor numérico. Operadores matemáticos Use operadores matemáticos para crear fórmulas para columnas numéricas y/o números. Por ejemplo, la expresión[Edad] + 1 añade una nueva columna con los valores 26, 31, 34 y 33. Operadores matemáticos Descripción + Operador de adición - Operador de sustracción * Operador de multiplicación / Operador de división () Paréntesis ^ Operador de potencia % Operador de porcentaje E Operador exponencial Operadores condicionales Use los operadores condicionales para crear expresiones IF THEN ELSE o SELECT. Operadores condicionales Descripción == Igual a != No igual a < Menor que > Mayor que <= Menor o igual a >= Mayor o igual a Operadores lógicos Use los operadores lógicos para comparar dos condiciones y obtener un resultado de "true" o "false". Por ejemplo, IF([Fecha de incorporación]>12/9/2005 && [Edad] >=25 ) THEN ('True') ELSE ('False') añade una nueva columna con los valores True, False, False, False. 116 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Operadores lógicos Descripción && Y || O 15.2.2 Muestra Sintaxis Utilice este componente para seleccionar un subconjunto de datos de conjuntos de datos mayores. El componente Muestra es compatible con los siguientes tipos de muestra: ● Primeros N: selecciona los primeros registros N del conjunto de datos. ● Últimos N: selecciona los últimos registros N del conjunto de datos. ● Cada N: Selecciona cada registro N del conjunto de datos, donde N es un intervalo. Por ejemplo, si N=2, se seleccionarán los registros 2, 4, 6, 8, etc. ● Aleatorización simple: selecciona registros aleatoriamente del tamaño N o un porcentaje de N de los registros de un conjunto de datos. ● Aleatorización sistemática: en este tipo de muestra, se crean intervalos simples o depósitos según el tamaño del depósito. El componente Muestra selecciona un registro N aleatoriamente del primer depósito y de cada depósito posterior. Propiedades de muestra Tipo de muestra Seleccione el tipo de muestreo. Limitar filas por Seleccione el método para limitar las filas. Número de filas Introduzca el número de filas que desee seleccionar. Porcentaje de filas Introduzca el porcentaje de filas que desee seleccionar. Tamaño del depósito Introduzca el tamaño del depósito en el que desee seleccionar una fila aleatoria. Tamaño de paso Introduzca el intervalo entre las filas que desee seleccionar. Filas máximas Introduzca el número máximo de filas que desee seleccionar. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 117 Ejemplo Seleccionar un subconjunto de datos de un conjunto de datos determinado ID del empleado Nombre del empleado Fecha de nacimiento Edad 1 Laura 11/11/1986 25 2 Desi 12/5/1981 30 3 Álex 30/5/1978 33 4 Juan 6/6/1979 32 5 Tomás 4/7/1987 24 6 Tobías 30/6/1970 41 7 Anna 24/6/1965 46 8 Valeria 6/7/1990 21 9 María 19/9/1985 26 10 Martín 21/11/1986 25 Salida de muestras: 1. 2. 3. 4. 118 Primeros N: donde N=5 ID del empleado Nombre del empleado Fecha de nacimiento Edad 1 Laura 11/11/1986 25 2 Desi 12/5/1981 30 3 Álex 30/5/1978 33 4 Juan 6/6/1979 32 5 Tomás 4/7/1987 24 ID del empleado Nombre del empleado Fecha de nacimiento Edad 7 Anna 24/6/1965 46 8 Valeria 6/7/1990 21 9 María 19/9/1985 26 10 Martín 21/11/1986 25 ID del empleado Nombre del empleado Fecha de nacimiento Edad 3 Álex 30/5/1978 33 6 Tobías 30/6/1970 41 9 María 19/9/1985 26 Últimos N: donde N=4 Cada N: Intervalo=3 Aleatorización simple: para un número de filas=2 El resultado pueden ser dos filas cualesquiera. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 5. ID del empleado Nombre del empleado Fecha de nacimiento Edad 7 Anna 24/6/1965 46 8 Valeria 6/7/1990 21 Aleatorización sistemática: tamaño del depósito=4 ID del empleado Nombre del empleado Fecha de nacimiento Edad 2 Desi 12/5/1981 30 6 Tobías 30/6/1970 41 10 Martín 21/11/1986 25 ID del empleado Nombre del empleado Fecha de nacimiento Edad 1 Laura 11/11/1986 25 5 Tomás 4/7/1987 24 9 María 19/9/1985 26 o 15.2.3 Definición del tipo de datos Sintaxis Use este componente para cambiar el nombre, el tipo de datos y el formato de fecha desde la columna de origen. Definir los tipos de datos ayuda a preparar los datos para que sean adecuados para un futuro análisis. Por ejemplo: ● Si el nombre de la columna del origen de datos es "des", es posible que no sea claro durante el análisis. Cambie el nombre de la columna a "Designation" en el análisis, de modo que los usuarios finales puedan comprenderlo fácilmente. ● Si la fecha está almacenada con el formato mmddaa (120201, sin separador de fecha), el sistema puede considerarlo como un valor entero. Mediante el componente Definición de tipo de datos, puede cambiar el formato de fecha a cualquier formato válido, como mm/dd/aaaa o dd/mm/aaaa, etc. Para cambiar el nombre, el tipo de datos y el formato de fecha de la columna de origen, realice los siguientes pasos: 1. Agregue el componente de definición de tipo de datos al análisis. 2. En el menú contextual de los componentes, seleccione Configurar propiedades. 3. Para cambiar el nombre de la columna, introduzca un alias para la columna de origen necesaria. 4. Para cambiar el tipo de datos de la columna, seleccione el tipo de datos necesario para la columna de origen. 5. Seleccione Fin. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 119 15.2.4 Filtro Sintaxis Utilice este componente para filtrar filas y columnas basándose en una condición específica. Nota El componente Filtro in-DB no es compatible con las funciones y las expresiones avanzadas. Nota Si modifica la fuente de datos después de configurar el componente de filtro, éste seguirá conservando los filtros de fila definidos con anterioridad. Propiedades de los filtros Columnas seleccionadas Seleccione las columnas para el análisis. Condición del filtro Introducir la condición del filtro. Ejemplo Filtrar la columna "Tienda" de los datos fuentes y aplicar la condición "Beneficio >2000". Tienda Ingresos Beneficio Hito 10000 1000 Ferrero 20000 4500 Soler 25000 8000 1. Deseleccione la columna "Tienda" de las columnas seleccionadas. 2. En el panel Filtro de fila, seleccione la columna Beneficio. 3. En la opciónSeleccionar desde rango, introduzca 2000 en el cuadro de texto Desde. El cuadro de texto Hastadebe quedar vacío. 4. Seleccione Aceptar. 5. Elija Guardar y cerrar. 6. Ejecute el análisis. Tabla de salida: Ingresos Beneficio 20000 4500 25000 8000 120 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Sintaxis Nota El componente de filtro solo es compatible con expresiones que devuelvan un resultado booleano. Por ejemplo, en la tabla Empleado que aparece a continuación: ID del empleado Nombre del empleado Fecha de nacimiento Edad Fecha de incorporación Fecha de confirmación 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 2 Desi 12/5/1981 30 24/6/2000 10/7/2000 3 Álex 30/5/1978 33 10/10/1998 24/10/1998 4 Juan 6/6/1979 32 2/12/1999 20/12/1999 ● La expresión DÍASENTRE([Fecha de incorporación],[Fecha de confirmación]) no es una expresión de filtro válida, ya que devuelve un valor numérico. El uso correcto de la expresión DÍASENTRE como filtro es DÍASENTRE([Fecha de incorporación],[Fecha de confirmación]) == 14. Esta expresión selecciona aquellas filas en las que el número de días entre la "fecha de incorporación" y la "fecha de confirmación" es 14. En la tabla anterior, se seleccionaría la tercera fila. ● En cambio, NOMBREDELDÍA([Fecha de incorporación]) == 'Sábado' selecciona la segunda y la tercera fila de la tabla Empleado. Nota Cuando se introduce una cadena literal que contiene comillas simples, cada comilla de la cadena literal debe ir precedida con un carácter de barra inversa (\). Por ejemplo, si desea escribir la palabra "Customer's", deberá escribir "Customer\'s". Nota Cuando se introduce un nombre de columna que contiene corchetes, cada corchete en el interior del nombre de la columna debe ir precedido con un carácter de barra inversa (\). Por ejemplo, si desea escribir [Cliente[Edad]], deberá escribir [Cliente\[Edad\]]. Funciones admitidas Nota El componente de filtro no es compatible con las funciones de manipulación de datos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 121 Categoría Función (Función cuando se aplica Descripción a la tabla Empleado) Fecha DÍASENTRE Devuelve el número de días entre dos fechas. FECHAACTUAL Devuelve la fecha actual del sistema. MESESENTRE Devuelve el número de meses entre dos fechas. Por ejemplo, la nueva columna contiene 2,0,2,0 cuando se aplica MESESENTRE([Fecha de incorporación],[Fecha de confirmación]) a la tabla Empleado. NOMBREDELDÍA Devuelve el nombre del día en formato de cadena. Por ejemplo, la nueva columna contendrá lunes, sábado, sábado, jueves cuando se aplique NOMBREDELDÍA([Fecha de incorporación]) a la tabla Empleado. NÚMERODEDÍADELMES Devuelve el número del día de un mes determinado. Por ejemplo, la fecha 12/11/1980 devuelve el número 12. NÚMERODEDÍADELASEMANA Devuelve el número de día de una semana. Por ejemplo, domingo=1, lunes=2. NÚMERODEDÍADELAÑO Devuelve el número de día de un año. Por ejemplo, el 1 de enero=1, 1 de febrero=32, 3 de febrero=34. ÚLTIMODÍADELASEMANA Devuelve la fecha del último día de la semana. Por ejemplo, la fecha 12/9/2005 devuelve 17/9/2005 ÚLTIMODÍADELMES Devuelve la fecha del último día del mes. Por ejemplo, la fecha 12/9/2005 devuelve 30/9/2005 NÚMERODEMESDELAÑO Devuelve el número del mes en una fecha. Por ejemplo, enero=1, febrero=2, marzo=3. 122 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Categoría Función (Función cuando se aplica Descripción a la tabla Empleado) NÚMERODESEMANADELAÑO Devuelve el número de semana en un año. Por ejemplo, 12/9/2005 devuelve 38. NÚMERODETRIMESTREDELAFECHA Devuelve el número del trimestre en una fecha. Por ejemplo, 12/9/2005 devuelve 3. Cadena CONCAT Concatena dos cadenas. Por ejemplo, la expresión CONCAT('EE.UU.','Australia') devuelve EE.UU.Australia. ENLACADENA Devuelve el resultado True si se encuentra la cadena buscada en la cadena fuente. Por ejemplo, la expresión ENLACADENA('EE.UU.','EU') devuelve el resultado True. SUBCADENA Devuelve una subcadena de una cadena fuente. Por ejemplo, la expresión SUBCADENA('EE.UU.',1,2) devuelve EE. Matemáticas Expresión condicional MAX Devuelve el valor máximo de una columna. MIN Devuelve el valor mínimo de una columna. CONTAR Devuelve el número de valores de una columna. SUMA Devuelve la suma de los valores de una columna. PROMEDIO Devuelve el promedio de los valores de una columna. IF(condición) THEN(expresión de cadena/expresión matemática/ expresión condicional) ELSE(expresión de cadena/expresión matemática/ expresión condicional) Comprueba si se cumple la condición y devuelve un valor si se cumple ("true") y otro si no se cumple ("false"). Por ejemplo, IF([Fecha de incorporación]>12/9/2005) THEN ('Empleado incorporado después del 12 de septiembre de 2005') ELSE ('Empleado incorporado el o antes del 12 de septiembre de 2005') Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 123 Nota Las expresiones matemáticas que contienen funciones que devuelve un valor numérico no son compatibles. Por ejemplo, la expresión NÚMERODEDÍADELMES(FECHAACTUAL())==2 no es compatible porque NÚMERODEDÍADELMES devuelve un valor numérico. Operadores matemáticos Use operadores matemáticos para crear fórmulas para columnas numéricas y/o números. Por ejemplo, la expresión[Edad] + 1añade una nueva columna con los valores 26,31,34 y 33. Operadores matemáticos Descripción + Operador de adición - Operador de sustracción * Operador de multiplicación / Operador de división () Paréntesis ^ Operador de potencia % Operador de porcentaje E Operador exponencial Operadores condicionales Use los operadores condicionales para crear expresiones IF THEN ELSE o SELECT. Operadores condicionales Descripción == Igual a != No igual a < Menor que > Mayor que <= Menor o igual a >= Mayor o igual a Operadores lógicos Use los operadores lógicos para comparar dos condiciones y obtener un resultado de "true" o "false". Por ejemplo, IF([Fecha de incorporación]>12/9/2005 && [Edad] >=25 ) THEN ('True') ELSE ('False') añade una nueva columna con los valores True, False, False, False. 124 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Operadores lógicos Descripción && Y || O 15.2.5 Normalización Sintaxis Use este componente para normalizar los datos de atributo. Los atributos con un valor mayor tienden a tener un peso mayor. La normalización intenta transformar los datos de un rango más grande a uno más pequeño, por ejemplo, [0,1], [-1,1]. Nota La normalización solo muestra las columnas con valores numéricos. El componente de normalización admite los siguientes métodos de normalización: ● Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza cada uno de ellos para ajustarlo a un rango específico. Al efectuar la normalización mín./máx., puede indicar un valor máximo nuevoy un valor mínimo nuevo.Esta normalización es útil para asegurar que los valores extremos están limitados dentro de un rango fijo. Nota ○ ● Nuevo valor máximo debe ser superior que el Nuevo valor mínimo. Normalización del resultado Z: cálculo basado en el medio y la desviación estándar de cada atributo. Esta normalización es útil para determinar si un valor específico está por encima o por debajo del promedio, y por cuánto. ● Normalización de escalado decimal: La coma decimal del valor de cada atributo se desplaza conforme a su valor absoluto máximo. Propiedades de normalización Seleccionar una columna Seleccione la columna que desee normalizar. Tipo de normalización Seleccione el tipo de normalización. Nuevo máximo Indique el valor del nuevo máximo. El valor predeterminado es 1. Nuevo mínimo Indique el valor del nuevo mínimo. El valor predeterminado es 0. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 125 Ejemplo Normalizar el tiempo utilizado para cubrir una distancia en concreto. Tabla: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 66 Desi 500 360 Álex 500 201 Juan 500 78 Tomás 500 504 Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes: 1. En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos. 2. Arrastre el componente Normalización al editor de análisis o haga doble clic en Normalización. 3. Desde el menú contextual del componente de normalización, seleccione Configurar propiedades. 4. Seleccione la columna que desea normalizar de la lista desplegable Seleccionar una columna. Nota Solo puede seleccionar las columnas con valores numéricos. Por ejemplo, Tiempo (en segundos). 5. Desde la lista desplegable Método de normalización, seleccione Mín-Máx. 6. Indique los valores para el Nuevo máximo y el Nuevo mínimo. En este ejemplo, los valores son 0 y 1 respectivamente. 7. Seleccione Finalizado y, a continuación, Ejecutar. Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 0.05 Desi 500 0.30 Álex 500 0.17 Juan 500 0.06 Tomás 500 0.42 Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni de Nuevo mínimo. Salida de la normalización del resultado Z: Tabla de salida: 126 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 -0.49 Desi 500 1.77 Álex 500 0.55 Juan 500 -0.40 Tomás 500 2.88 Salida de la normalización del escalado decimal: Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 0.01 Desi 500 0.04 Álex 500 0.02 Juan 500 0.01 Tomás 500 0.05 15.2.6 Categorización de HANA Sintaxis La categorización, también conocida como discretización, suaviza un valor de datos ordenado. Divide el rango de una variable numérica en conjuntos de subrangos, denominados almacenajes, y reemplaza cada valor por su número de almacenaje. Realizar el almacenaje de datos antes de ejecutar determinados algoritmos, como el algoritmo de árbol de decisiones, ayuda a reducir la complejidad del modelo. Existen cuatro métodos de categorización: ● Anchos iguales basados en el número de agrupamientos ● Anchos iguales basados en el ancho del agrupamiento ● Igual profundidad ● Desviación del medio Y tres métodos para el suavizado: ● Suavizado por medios de agrupamiento: cada valor de un agrupamiento se reemplaza por un valor de agrupamiento del medio. ● Suavizado por medianas de almacenaje: cada valor de almacenaje se reemplaza por la mediana de almacenaje. ● Suavizado por límites de agrupamiento: los valores máximos y mínimos de un agrupamiento dado se identifican como los límites de agrupamiento. A continuación, cada valor de agrupamiento se reemplaza por el valor de límite más cercano. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 127 Propiedades de la categorización de HANA Columna independiente Seleccione la columna de origen de entrada en la que desea realizar la categorización. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes. ● Conservar: conserva los valores que faltan. Método de categorización Seleccione el método de categorización. Número de agrupamientos Introduzca el número de agrupamientos necesarios. Método de suavizado Seleccione el método de suavizado. Nombre de columna agrupada Introduzca un nombre para la nueva columna que contiene números de agrupación. Nombres de columna de valores suavizada Introduzca el nombre de la columna nueva que contiene los valores suavizados. Ejemplo Realizar la categorización de datos en un conjunto de datos Ciudad Temperatura Amsterdam 6 Fráncfort 12 Cantón 13 Ciudad de El Cabo 15 Waldorf 10 Bangalore 23 Bombay 24 Miami 30 Río de Janeiro 32 Sídney 25 Dubai 38 Para realizar el agrupamiento de la columna Temperatura por anchos iguales basado en el número de anchos y aplicar métodos de suavizado por medios, lleve a cabo los siguientes pasos: 1. 128 Arrastre el componente Categorización de HANA al editor de análisis. © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 2. Haga doble clic en Categorización de HANA o pase el cursor del ratón por encima de Categorización de HANA y seleccione Configurar propiedades. 3. En la lista desplegable Columna independiente, elija una columna. Nota Solo se pueden seleccionar las columnas que tengan valores en forma de dígito numérico. Por ejemplo, Temperatura. 4. En la lista desplegable Valores faltantes, seleccione Omitir. 5. En Método de categorización, seleccione Anchos iguales basados en el número de agrupamientos. 6. En el número de agrupamientos, introduzca 4. 7. Seleccione Suavizado obligatorio. 8. En los métodos de suavizado, seleccione Medio de agrupamiento. 9. En Introducir nombre para la columna agregada recientemente, en Nombre de columna agrupada, introduzca Agrupamiento de temperatura. Nota Puede dar un nombre a la columna según sus preferencias o requisitos de análisis. Esta columna contiene el valor agrupado. 10. En Introducir nombre para la columna agregada recientemente, en Columna suavizada, introduzca Suavizado de temperatura. Nota Puede dar un nombre a la columna según sus preferencias o requisitos de análisis. Esta columna contiene el valor suavizado. Tabla de salida: Ciudad Temperatura Agrupamiento de temperatura Suavizado de temperatura Amsterdam 6 1 8.0 Fráncfort 12 2 13.33333 Cantón 13 2 13.33333 Ciudad de El Cabo 15 2 13.33333 Waldorf 10 1 8.0 Bangalore 23 3 25.5 Bombay 24 3 25.5 Miami 30 3 25.5 Río de Janeiro 32 4 35.0 Sídney 25 3 25.5 Dubai 38 4 35.0 Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 129 15.2.7 Normalización de HANA Sintaxis Use este componente para normalizar los datos de atributo. La normalización de HANA escala los grandes datos de atributo de valor para que entren en un rango específico, como -1.0 a 1.0, o 0.0 a 1.0. Puede usar este componente para el análisis en base de datos. La normalización de datos es útil para los algoritmos de clasificación que implican redes neurales, o medidas de distancia, como la clasificación y agrupamiento en clúster de los vecinos más cercanos. Nota Si desea que los datos procesados reemplacen la columna existente, seleccione Reemplazar columna. El componente de normalización admite los siguientes métodos de normalización: ● Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza cada uno de ellos para ajustarlo a un rango específico. Al realizar la normalización mínima-máxima puede especificar el Nuevo valor máximo y el Nuevo valor mínimo. Esta normalización es útil para asegurar que los valores extremos están limitados dentro de un rango fijo. Nota ○ ● Nuevo valor máximo debe ser superior que Nuevo valor mínimo. Normalización del resultado Z: cálculo basado en el medio y la desviación estándar de cada atributo. Esta normalización es útil para determinar si un valor específico está por encima o por debajo del promedio, y por cuánto. ● Normalización de escalado decimal: La coma decimal de los valores de cada atributo se desplaza conforme a su valor absoluto máximo. Nota Puede seleccionar Reemplazar columna, si desea que los datos normalizados reemplacen los datos de la columna existentes, en los que se lleva a cabo la normalización. Ejemplo Normalizar el tiempo utilizado para cubrir una distancia en concreto. Tabla: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 66 Desi 500 360 Álex 500 201 Juan 500 78 Tomás 500 504 Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes: 130 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes 1. En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos. 2. Arrastre el componente Normalización de HANA al editor de análisis o haga doble clic en Normalización de HANA. 3. Haga doble clic en Normalización de HANA o pase el puntero del ratón por encima de Normalización de HANA y seleccione Configurar propiedades. 4. Seleccione las columnas que desee normalizar. Nota Solo puede seleccionar las columnas con valores numéricos. Por ejemplo, Tiempo (en segundos). 5. Desde la lista desplegable Tipo de normalización, seleccione Mín-Máx. 6. Introduzca los valores para Nuevo máximo y Nuevo mínimo. 7. Seleccione Finalizado y, a continuación, Ejecutar. Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Tiempo (en segundos)_Normalizado Laura 500 66 0.05 Desi 500 360 0.30 Álex 500 201 0.17 Juan 500 78 0.06 Tomás 500 504 0.42 Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni de Nuevo mínimo. Salida de la normalización del resultado Z: Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 -0.49 Desi 500 1.77 Álex 500 0.55 Juan 500 -0.40 Tomás 500 2.88 Salida de la normalización del escalado decimal: Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 0.01 Desi 500 0.04 Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 131 Nombre Distancia (en metros) Tiempo (en segundos) Álex 500 0.02 Juan 500 0.01 Tomás 500 0.05 15.3 Grabadores de datos Use los grabadores de datos para almacenar los resultados de los análisis en archivos planos o bases de datos para su análisis posterior. 15.3.1 CSV Writer Sintaxis Use este componente para escribir datos en archivos planos como archivos CSV, TEXT y DAT. Propiedades de CSV Writer Nombre de archivo Seleccione la ruta de archivos e introduzca el nombre del archivo .csv, .dat o .txt. Sobrescribir si existe Seleccione esta opción para sobrescribir un archivo existente. Separador de columnas Seleccione un delimitador de columnas que separe los tokens de datos del archivo. Introducir carácter de comillas sencillas Seleccione el carácter para reemplazar los separadores de columna mientras escribe los datos. Incluir encabezados de columna Seleccione esta opción para usar la primera fila como encabezado de columna. Codificación Seleccione el método de codificación de texto para escribir los datos. Separador de decimales Seleccione el carácter para la representación decimal en la agrupación de dígitos. Separador de agrupaciones Seleccione el carácter para el separador de miles. 132 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes Formato de número Introduzca el formato de número que desea aplicar a los datos numéricos. Formato de fecha y hora Seleccione el formato de fecha que desea aplicar a las fechas. 15.3.2 JDBC Writer Sintaxis Use este componente para escribir datos en bases de datos relacionales, como MySQL, MS SQL Server, DB2, Oracle, SAP MaxDB y SAP HANA. Propiedades de JDBC Writer Tipo de base de datos Seleccione el tipo de base de datos. Ruta del controlador de base de datos Introduzca la ubicación de la ruta del controlador JDBC. Por ejemplo, para escribir en la base de datos de Oracle, debe especificar la ubicación del archivo jar JDBC de Oracle (C: \ojdbc6.jar) Nombre de base de datos de equipo Introduzca el nombre del equipo en el que está instalada la base de datos. Número de puerto Introduzca el número de puerto de la base de datos o del servicio. Nombre de base de datos Introduzca el nombre de la base de datos. Nombre de usuario Introduzca el nombre de usuario de la base de datos. Contraseña Introduzca la contraseña para el usuario de la base de datos. Tipo de tabla Introduzca el tipo de tabla. Esta propiedad se aplica al escribir en la base de datos de SAP HANA. Nombre de tabla Introduzca el nombre de la tabla. Sobrescribir si existe Seleccione esta opción para sobrescribir la tabla si ya existe. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. 133 15.3.3 HANA Writer Sintaxis Use este componente para escribir datos en tablas de bases de datos SAP HANA. Componente HANA Writer Nombre de esquema Seleccione un esquema. Tipo de tabla Seleccione el tipo de tabla para la tabla en la que desea escribir los datos. Nombre de tabla Indique un nombre para la tabla. Sobrescribir si existe Seleccione esta opción para sobrescribir la tabla si ya existe. 15.4 Modelos Los modelos que cree guardando el estado de los algoritmos se muestran en forma de lista en la sección Modelos de la lista Componentes. La aplicación SAP Predictive Analysis no contiene modelos predefinidos. Por lo tanto, cuando se inicia la aplicación por primera vez, no se muestra la sección Modelos. Para obtener información sobre la creación de un modelo nuevo, consulte la sección "Crear un modelo" en Trabajar con modelos. 134 © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Manual del usuario de SAP Predictive Analysis Propiedades de los componentes www.sap.com/contactsap © 2014 SAP AG o una filial de SAP. Reservados todos los derechos. Queda prohibida la reproducción o transmisión de cualquier parte de esta publicación, en cualquier forma o para cualquier fin, sin el permiso expreso de SAP AG. La información que aquí se incluye puede modificarse sin previo aviso. Algunos productos de software comercializados por SAP AG y sus distribuidores contienen componentes de software con derechos de autor de otros proveedores de software. Las especificaciones de productos en cada país pueden ser diferentes. Estos materiales los proporcionan SAP AG y sus empresas afiliadas ("SAP Group") con carácter informativo, sin declaración ni garantía de ningún tipo y SAP Group no se hace responsable de los errores u omisiones en dichos materiales. Las únicas garantías para los productos y servicios de SAP Group son aquellas especificadas en las cláusulas expresas de garantía que acompañan a dichos productos y servicios, si las hubiera. Nada de lo que aparezca en este documento debe interpretarse como garantía adicional. SAP y otros productos y servicios de SAP mencionados, así como sus respectivos logotipos, son marcas comerciales o marcas registradas de SAP AG en Alemania y en otros países. Consulte http://www.sap.com/corporate-en/legal/copyright/ index.epx para obtener información y avisos adicionales sobre marcas comerciales.
© Copyright 2024