TERADATA MEJORA LAS LIMITACIONES DE LOS ANALÍTICOS R DE CÓDIGO ABIERTO
.jpg)
En la actualidad, los
analistas R tienen el desafío de obtener el máximo beneficio de R cuando el
mismo es utilizado en un único servidor y solo funciona en un entorno en
memoria. Esto último, sin embargo, restringe la cantidad de datos que pueden
ser procesados y puede conducir a una performance lenta del análisis complejo.
Teradata mejora el procesamiento de datos y reduce las limitaciones de memoria
al permitir la ejecución paralela en base de datos para el análisis R. Ejecutar
R en la base de datos posibilita el procesamiento a una alta velocidad de
cantidades masivas de datos, atendiendo las necesidades de análisis de la
organización. Además, Teradata permite acceder e integrar información desde
múltiples fuentes y utilizar una gama más amplia de análisis, logrando óptimos
resultados.
Cabe destacar que R es
un lenguaje estadístico y software de código abierto para mineros y científicos
de datos. Según los resultados de una encuesta sobre
minería de datos de 2013, el número de mineros de datos que utilizan R está
creciendo: un 70 por ciento de los encuestados respondió que se encontraban
implementando este lenguaje.
“Teradata Aster R
entrega el poder del análisis R a las empresas”, dijo Scott Gnau, Presidente de Teradata Labs. “Para apoyar a los
analistas R, Teradata brinda un lenguaje R familiar y herramientas, facilitando
poder de procesamiento masivo y análisis enriquecido sin precedentes. Además,
los analistas tienen acceso a un inmenso volumen de información integrada desde
múltiples fuentes.”
De esta manera,
Teradata Aster R apalanca una plataforma de cómputos de alta performance con
grandes ventajas en seguridad, gestión de datos y análisis. A continuación, se
detallan tres componentes claves de la nueva solución:
Teradata
Aster R Library – Esta librería incluye más de 100
funciones R pre construidas que funcionan paralelamente a través de toda la
información, eliminando la complejidad del procesamiento paralelo. Los
analistas ya no necesitan pasar varios días codificando un algoritmo paralelo,
ya que ahora tienen acceso inmediato a las funciones paralelas R, cubriendo un
rango de tareas que abarcan desde manejo de datos, acceso, exploración y
manipulación, hasta aprendizaje automático de algoritmos. Asimismo, Teradata ha
aumentado las capacidades de código abierto R con análisis de alto poder
incluyendo el patentado Teradata Aster nPath™.
Teradata
Aster R Parallel Constructor – Este
componente de Teradata Aster R permite a los analistas construir sus análisis
paralelos con más de 5,500 paquetes de análisis R o cualquiera de las nuevas
funciones analíticas desarrolladas en la comunidad de fuente abierta.
Teradata
Aster SNAP Framework™ Integration –El motor
R de código abierto ha sido integrado al Teradata Aster SNAP Framework, lo que
permite una diversidad de motores de análisis múltiple y almacenamiento de
archivos para ajustarse perfectamente a las necesidades de descubrimiento de
los analistas. Esta perfecta integración de múltiples capacidades analíticas
mejora el poder analítico. Los científicos de datos pueden ahondar
profundamente en la información con variadas capacidades analíticas como
gráficos, MapReduce, texto, estadísticas, series temporarias y análisis R desde
un único programa. Teradata aumentó la Aster R library con módulos de
alto poder de análisis gráfico para apoyar a Teradata Aster SQL-GR™, un motor de procesamiento gráfico. Los
científicos de datos podrán recurrir al análisis de gráficos para el examen de
redes sociales, detección de fraude y propagación
de creencias, un algoritmo especializado para realizar modelado de
probabilidad.
“La rápida adopción de
R y su probado valor trae como resultado que las organizaciones que buscan
conducir nuevos insights para la generación de ganancias, deberían incluir a R
como parte de su estrategia de análisis predictivo,” afirmó James Taylor,
CEO de Decision Management Solutions. “Las organizaciones que adoptan R deberían
recurrir a vendedores con un sólido plan para apoyar este lenguaje y proveer
implementaciones escalables”.
Caso
de Uso de Análisis R
Un proveedor de
películas online debe predecir futuras ganancias y tomar acciones para detener
la potencial reducción de consumidores rentables, al mismo tiempo de asegurarse
que estos últimos mejoren su experiencia visual. El proveedor de películas
entonces asigna la tarea a un analista R para que lo ayude a entender las
preferencias de compras de los clientes y las necesidades de servicios. Sin
embargo, el analista R no puede acceder e integrar todos los datos necesarios
requeridos debido a las limitaciones de memoria y procesamiento. Si el análisis
fue ejecutado en un único servidor, con un entorno en memoria, es probable que
no sea completado a tiempo para responder a las necesidades del usuario
comercial.
En este sentido,
Teradata Aster R permite al analista superar las limitaciones de memoria y
procesamiento. Un análisis en base de datos de alta velocidad puede ejecutarse
fácilmente sobre toda la información requerida, incluyendo metadatos de
películas, búsqueda de clientes, visión de la historia, e información de cuenta
desde ApacheTM HadoopTM y Teradata. Con esos insights, el proveedor de
películas online puede tomar decisiones para atender mejor a los clientes.
Los
servicios de Consultoría y clientes de Teradata ofrecerán apoyo de nivel
empresarial y las mejores prácticas para Teradata Aster R. Teradata Aster R
estará disponible para el cuarto trimestre de 2014.
No hay comentarios:
Publicar un comentario