Quantcast
Channel: Business Intelligence y Big Data: ¡Aprende Gratis sobre Analytics!
Viewing all 575 articles
Browse latest View live

Las 10 mejores charlas TED de Analisis de Datos

$
0
0

Las 20 mejores librerias para Data Scientists en R

Aprender procesos ETL con Pentaho Data Integration para Big Data

$
0
0








Una de las grandes ventajas de Pentaho Data Integration, es la forma en que facilita y ayuda a orquestar trabajos en entornos Big Data. 

Nuestros compañeros de stratebi, especialistas en formación eminentemente práctica y proyectos Big Data Analytics nos muestran algunos ejemplos de algunos de los temas de sus formaciones




También podéis ver algunas de sus aplicaciones online con las arquitecturas que lo soportan

Estos son parte de los ejercicios propuestos en este capítulo y que serás capaz de realizar son:

Ejercicio 1: Escribir archivos en HDFS en el clúster
Ejercicio 2: Leer archivos desde HDFS
Ejercicio 3: Leer datos desde Hive con PDI



Ejercicio 4: Movimiento de archivos con Jobs de PDI
Ejercicio 5: Transformación de Hive de creación de bases de datos
Ejercicio 6: Pasar archivos de una base de datos Oracle a una base de datos de Hive ORC


















Las mejores APIs para Machine Learning

$
0
0

Imprescindible: Si estas creando un moderno Data Warehouse o Data Lake

$
0
0

Este Landscape es muy útil para conocer las principales tecnologías y herramientas, que dentro de todo el ciclo de vida de creación y explotación de datos en una organización se pueden utilizar

Hemos trabajado y conocemos la mayor parte de ellas, también publicamos comparativas y benchmarks, etc..

Si nos quieres preguntar o consultar sobre las mejores alternativas, combinaciones de tecnologías, etc... escríbenos!!

Top Business Intelligence Tools study

$
0
0

This complete, 300 pages study, is a comprehensive comparative of some of the most important Business Intelligence tools (this study will include new tools in next editions). 

Has been created by analytics experts Stratebi. This document include in depth features, modules and architecture analysis, considering:

- PowerBI
- Tableau
- Qlikview
- Pentaho
- SAS
- Information Builders
- Amazon Quicksight

A very complete study for all business intelligence interested who are evaluating to use some of this tools


Descarga gratis el Estudio: 'Impacto del Big Data y Advanced Analytics en España'

$
0
0

Muy interesante el estudio que ha realizado Esade y puedes descargar sobre el uso del Big Data y Advance Analytics en España, tema que nos encanta en TodoBI





El presente estudio nace con el objetivo de conocer el estado de adopción e impacto que está teniendo el Big Data en las empresas de nuestro país. 

Aquí podemos ver los problemas a los que se enfrentan las compañías en sus iniciativas Big Data Analytics:





Mediante un cuestionario dirigido a los responsables ejecutivos y técnicos de las mismas, se ha analizado a las compañías respecto a  cinco dimensiones:

1) Visión  estratégica  y  modelo  organizativo 
2) Inversión  y  creación  de  valor 
3) Cultura y talento



4) Infraestructura de datos
5) Prioridades a futuro



Aprende SQL descubriendo un asesinato

$
0
0

Genial esta iniciativa!! SQL Mysteries

Empieza ya aquí

Los experimentados detectives de SQL empiezan aquí:

Ha ocurrido un crimen y el detective necesita tu ayuda. 
El detective te dio el informe de la escena del crimen, pero de alguna manera lo perdiste. 
Usted recuerda vagamente que el crimen fue un asesinato que ocurrió en algún momento el 15 de enero de 2018 y que tuvo lugar en SQL City. 
Empiece por recuperar el informe correspondiente de la escena del crimen de la base de datos del departamento de policía.

Exploración de la estructura de la base de datos:

Los usuarios experimentados de SQL a menudo pueden utilizar consultas a la base de datos para inferir la estructura de una base de datos. 
Pero cada sistema de base de datos tiene diferentes maneras de gestionar esta información. 
El misterio del asesinato de SQL se construye usando SQLite. Usa este comando SQL para encontrar las tablas en la base de datos de Murder Mystery.


The Timeline of Statistics (Machine Learning)

Paper: Forecasting para predicciones mensuales (Machine Learning)

$
0
0

En este documento se aplicará el método Box and Jenkins para el análisis de una serie temporal, en concreto, para las ventas de comida para llevar (en billones) en Australia durante el periodo abril/1980-abril/2014.  


Descargar paper (40 págs.)

Para ello nos serviremos del software estadístico R. Cabe decir que los modelos SARIMA están recomendados fundamentalmente para las predicciones mensuales, ya que las predicciones mensuales poseen habitualmente una estacionalidad simple y regular (única y sin alteraciones irregulares provocadas por factores añadidos como los festivos). 




Sin embargo, las series diarias o semanales suelen poseer estacionalidad compleja (e.g., semanal y anual) e irregular (más de una y con alteraciones). Por tanto, recomiendo los modelos SARIMA únicamente para los casos en los que se trate una serie de datos mensuales.

Mas contenido interesante sobre Machine Learning:


Por que muchos Data Scientist estan dejando sus trabajos?



Muy revelador lo que nos cuentan en este articulo del Towards Data Science, y que coincide con muchas situaciones y casos reales que conocemos y que se están produciendo. La frustración con el día a día del trabajo de los Data Scientist, respecto a las expectativas es importante (muchos conocéis que es llamado 'el trabajo más atractivo del siglo XXI'). La realidad es que muchos abandonan sus puestos de trabajo en grandes compañías, cuando parecían...


Nueva solucion Machine Intelligence: Pentaho, R, Python y Spark juntos para Machine Learning Analytics



Se acaba de presentar Machine Intelligence: el plugin para Pentaho Data Integration que facilita enormemente la ejecución de algoritmos sobre tecnologías Machine Learning, orquestados desde un completo entorno gráfico ETL Gracias a este plugin puedes convertir algoritmos de machine learning en 'steps' de PDI desde R, Python, Spark y Weka Gracias a este plugin consigues de forma sencilla: Hacer Machine Learning mucho más sencillo de...


Curso gratuito de Machine Learning por Google



Gran curso el que ofrece Google sobre Machine Learning, aprendizaje automático. Os lo recomendamos (Curso) Mas sobre Machine Learning: - Las 53 claves para conocer Machine Learning ...


Guide: Machine Learning for Software Engineers



Based on How I plan to become a machine learning engineer, you can/should follow this course if your are interested on this topics: Table of Contents What is it? Why use it? How to use it Follow me Don't feel you aren't smart enough About Video Resources Prerequisite Knowledge The Daily Plan Motivation Machine learning overview Machine learning mastery Machine learning is fun Inky Machine Learning Machine Learning: An In-Depth Guide Stories...


Los 30 mejores proyectos de Machine Learning Open Source



Como sabéis, el Machine Learning es uno de los temas que más nos interesan en el Portal y, máxime, cuando gran parte de las tecnologías son Open Source. En esta entrada, os indicamos los 30 proyectos más interesantes en en este año. Os dejamos también el material que publicamos con las claves del Machine Learning y una introducción Ver también, VideoTutorial No 1 FastText: Library for fast text representation and classification....



Whitepaper gratuito 'Usos de Machine Learning por sectores'



Ya tenéis disponible un Estudio muy interesante de más de 60 páginas, que os podéis descargar gratuitamente desde el enlace anterior Que podéis encontrar? Más información: Plataforma Online de Soluciones Big Data y Machine Learning (Demos y Aplicaciones) Aplicación práctica de Machine Learning con Bases de Datos Analyticas. Descargar Paper VideoTutorial Machine Learning para Predicción de Ventas VideoTutorial PowerBI con R Aplicación...


Mas de 20 Tecnicas y Tipos de Analisis Machine Learning y Analytics



A continuación, os detallamos las principales técnicas y tipos de análisis que se realizan en Big Data, muchas veces agrupadas bajo nombres como algoritmos, machine learning, etc.... pero que no siempre se explican correctamente Aquí os hemos creado algunos ejemplos online usando algunas de estas técnicas Si quieres saber más, puedes consultar también otros posts relacionados: - Las 53 Claves para conocer Machine Learning - 69 claves...


Como usar Machine Learning para hacer Data Quality



Las empresas cada vez necesitan almacenar y procesar más datos sobre sus clientes, proveedores, personal o pedidos. Sin embargo, a mayor Volumen de datos, mayor es la probabilidad de que existan datos incorrectos, como las direcciones o teléfonos que afecten de forma negativa a nuestro negocio. Por ejemplo, un pedido con una dirección errónea será devuelto, reduciendo el beneficio de la empresa y la confianza del cliente. Teniendo en cuenta...


Las 53 Claves para conocer Machine Learning



Si hace unos días os presentábamos las 69 claves para conocer Big Data, hoy os traemos las 53 Claves para conocer Machine Learning.  Que lo disfrutéis, si quereis conocer más o practicar, tenemos cursos Tambien os recomendamos: Una breve historia del Machine Learning ...


Una 'breve' Historia del Machine Learning



Hoy en día, el concepto de Machine Learning, está muy en boga, pero muchos lo entremezclan con la estadistica, las matemáticas, el Big Data, etc... para ello, que mejora hacer un repaso histórico de su evolución para conocerlo mejor Historia del Machine Learning: 1950 — Alan Turing creates the “Turing Test” to determine if a computer has real intelligence. To pass the test, a computer must be able to fool a human into believing it is also human. 1952...

How to create a Data Mart with reports and dasboards in just 8 minutes (open source)

$
0
0
Really impressive how simple it is to create a Data Mart and be analyzed with reports, OLAP cubes and Dashboards in a matter of minutes using LinceBI

The best thing is that you can do it with a solution based on open source, without cost of licenses and with professional support guaranteed.
A good alternative at no license cost to PowerBI, Tableau, Qliksense...

You can try more in detail in this online demo and check this '8 minutes Data Mart and Analysis ready to go'

Comparacion Azure-Google-Amazon para DW

$
0
0
Muy interesante comparación del coste según performance de las principales soluciones Cloud para Analytics Data Warehouse

- Azure DW
- AWS Redshift
- Google Big Query

También puedes considerar otras opciones como Vertica o Smowflake




11 Consejos sobre Bad Data: el enemigo silencioso en Business Intelligece y Big Data

$
0
0



Para todos los que llevamos un tiempo en esto del Business Intelligence, Big Data, Machine Learning, Analytics... vemos que se dedica mucho tiempo a hablar de las nuevas tecnologías, casos de uso, aplicaciones, etc... pero muy poco del verdadero problema y condicionante para lograr una exitosa implementación de estas tecnologías y proyectos: el Bad Data

Nuestro colaborador Emilio Arias, de Stratebi nos da unas pautas:

Como lo reconoces?

1) Son datos imprecisos, erróneos e incompletos que provocan problemas para lleva a cabo la estrategia de la empresa

2) Implica una mala toma de decisiones y una mala ejecución de las mismas

3) El coste del 'Bad Data', según estudios de IBM, les puede suponer a las empresas, hasta un 30% de los ingresos

4) En tu compañía no usas herramientas ETL (Integración, Transformación y Carga) o las usas mal, para mejorar los procesos de adquisición, depurado y limpieza de datos. Las hay open source (Pentaho Data Integration y Talend). El coste no será problema

5) Tu información está desestructurada, sin maestros (MDM te suena a chino) e información heterogénea no integrada

6) Querrías incluir datos de redes sociales, APIs, logs, IoT, etc... pero no sabes como distinguir el 'Bad Data' del 'Smart Data'

7) Querrías aplicar 'Machine Learning', pero sabes que con datos erróneos, cualquier algoritmo, por muy ajustado que fuera, te daría resultados sin confianza

8) Cada área, departamento o especialista de tu empresa tiene su propia metodología para aplicar criterios en cuanto a identificar el 'Bad Data'. Data Governance es un sueño idealizado para tí


9) 'Si metes basura, obtendrás basura'. Este aforismo ha funcionado muy bien en Analytics durante años. El problema ahora es que no consigues diferenciar la basura del resto. Se hace urgente poner en marcha una 'Planta de tratamiento de Residuos Analíticos' en tu organización. Funciona igual, separar basura de información útil

10) Querrías convertir el 'Bad Data' en 'Smart Data', pero ni siquiera sabes si esto es factible, cómo para saber lo que te costaría (tiempo y dinero)

11) Conoces los '7 magníficos' que puedes reconocer en el  'Bad Data'?

- Te faltan datos. No hay información, donde debería haberla
- Los datos son incorrectos ('no cuadra', seguro que os suena)
- Los datos no están bien ubicados. A veces, tenemos los datos correctos en origen, pero no los ubicamos correctamente
- Errores de entrada de datos: caracteres erróneos, abreviaturas, traducciones, etc...
- Datos duplicados. No siempre tiene que ser un error, a veces es algo tan trivial como una empresa que cambia de CIF y no actualizas
- Datos no revisados o aprobados. Mucha información requiere de la revisión y aprobación por parte de los responables
- Exceso de Datos. Sí, aunque no lo consideréis, si tenéis exceso de datos, se convierten en 'Bad Data'. Querer analizar cambios de estado de un asiento contable realizados en un día concreto... no suele proporcionar 'decisiones estratégicas'

Solución? En este Portal hablamos mucho de aplicar correctamente ETL, Data Quality, AgileBI, etc... pero lo más importante es 'perseverar' en dichas iniciativas 

El Bad Data nunca se va a acabar (que lo sepáis), es como cierta contaminación que siempre aparece, pero hay formas de reducirla, anticiparse y... casi, eliminarla


Curso online de PowerBI (4, 5 de Noviembre)

$
0
0


Los próximos lunes y martes (4 y 5 de Noviembre) tienes un más que interesante curso Online (100% guiado con profesor), compartiendo escritorio y eminentemente práctico, realizado por nuestro compañeros deStratebi. No te lo pierdas!!

Temario y Registro. Solo 95€!!

Apúntate y podrás hacer Dashboards como estos e integrar con Machine Learning y Big Data:

 





Mas info sobre PowerBI:


PowerBI: Arquitectura End to End



En el diagrama superior tenéis de forma actualizada, todo el ecosistema de PowerBI. Muy útil y clarificador Saber más sobre PowerBI: Use Case Big Data “Dashboards with Hadoop and Power BI” septiembre 03, 2019  big data, hadoop, olap, powerBi  3 comments In recent posts, we explained how to fill the gap between Big Data and OLAP, using Tableau, Pentaho and Apache Zeppelin. Now, we´ll show you how...


Como funciona Microsoft Power BI? Todo lo que necesitas saber



Todo lo que necesitas saber sobre la herramienta de Data Discovery que está revolucionando la toma de decisiones en las empresas lo tienes aquí: Para saber más de PowerBI (ver demos online en enlace anterior, cursos e info a continuación): Big Data para PowerBI febrero 19, 2019  big data, lincebi, open source, Pentaho, powerBi  4 comments Power BI es un conjunto de herramientas...


Como integrar Salesforce y PowerBI



Os contamos las posibilidades de integración de las dos soluciones Business Intelligence y CRM más extendidas del mercado: PowerBI y Salesforce Gracias a la posibilidad de integración de las herramientas se abre una gran cantidad de posibilidades Ahora puede obtener información en tiempo real de los datos de Salesforce mediante la conexión a través de Power BI Según los principales estudios, tanto Salesforce como Microsoft PowerBI lideran...


Big Data para PowerBI



Power BI es un conjunto de herramientas Business Intelligence (BI) desarrolladas por Microsoft. De reciente aparición, gracias a su simplicidad y potencia se ha hecho un un hueco entre las grandes del mercado como Tableau, Pentaho o Microstrategy.  Al igual que estas últimas, implementa la filosofía de Autoservicio para el usuario final (Self Service BI) llevada al extremo de la sencillez, pero con un gran número de características...


Usando Python con PowerBI



Muy interesante la nueva funcionalidad que permite el uso de Python en PowerBI, que se añade a la ya conocida capacidad con R, que os comentábamos no hace mucho En este artículo de Tommi Ranta explica paso a paso como preparar un entorno Python, habilitar Python en Power BI, importar datos y aplicar clustering a los datos y crear visualización personalizadas en Power BI utilizando Python.  Todo el material necesario para replicar...


Videotutorial: Usando R para Machine Learning con PowerBI



Si te gusta el Business Intelligence, Machine Learning y conoces algo de R, no te puedes perder este Videotutorial: Temario del Videotutorial: 1º Posibilidades de R dentro de Power BI  2º Instalar R y RStudio  3º Matriz de Correlación para el sector Retail  4º Árbol Decisión Titanic  5º Clustering K-Means Estados Unidos  6º Clustering DBSCAN Estados Unidos para detectar Outliers  7º Forecasting Exponencial Smoothing...


Las 50 claves para aprender y conocer PowerBI



Si tenéis curiosidad por conocer sobre todas las posibilidades de PowerBI, como funciona, integración, costes, etc... no te puedes perder este documento.  Altamente recomendable!!! También te puede interesar: Las 50 claves para conocer Futbol Analytics julio 18, 2018  Analytics, big data, open source, Stratebi, Tablero Futbolero  No comments Os presentamos un estudio muy...

LinceBI, the best Analytics/BigData open source based solution!!

$
0
0

As powerful as an enterprise version, with the advantages of being Open Source based. Discover LinceBI, the most complete Bussines Intelligence platform including all the functionalities you need

A non lincense, open source based, alternative to PowerBI


Dashboards
  • User friendly, templates and wizard
  • Technical skills is not mandatory
  • Link to external content
  • Browse and navigate on cascade dependency graphs
Analytic Reporting
  • PC, Tablet, Smartphone compatibility
  • Syncs your analysis with other users
  • Download information on your device
  • Make better decisions anywhere and anytime
Bursting
  • Different output formats (CSV, Excel, PDF, HTML)
  • Task scheduling to automatic execution
  • Mailing
Balance Scorecard
  • Assign customized weights to your kpis
  • Edit your data on fly or upload an excel template
  • Follow your key performance indicators
  • Visual kpis, traffic lights colours
  • Assign color coding to your threshold
  • Define your own key performance indicators
Accessibility
  • Make calculated fields on the fly
  • Explore your data on chart
  • Drill down and roll up capabilities
  • What if analysis and mailing

Adhoc Reporting
  • Build your reports easily, drag and drop
  • Models and languaje created to Business Users
  • Corporative templates to your company
  • Advanced filters
Alerts
  • Configure your threshold
  • Mapping alerts and business rules
  • Planning actions when an event happen
Check FAQs section for any question



    Internet of Things (Timeline)

    $
    0
    0

    No dejéis de echar un vistazo a esta infografía. Muy útil!!

    Haciendo funcionar un Cluster Hadoop

    $
    0
    0


    Os mostramos un ejemplo de como hacer funcionar un Cluster Hadoop con ejemplos y aplicaciones prácticas:




    Se trata de un clúster Hadoop con la distribución de Hadoop de Hortonworks HDP 2.6.5, la cual es 100% open source e incluye las últimas versiones de Apache Hive, Spark, Kafka, Superset, Zeppelin y Druid. Además hemos instalado la herramienta para OLAP con Big Data Apache Kylin con la que hemos implementado algunas de nuestras demos de Big Data Analytics disponibles en Big Data Demos



    El clúster está compuesto de 3 máquinas de 32 Gb de Ram y 8 cores, es decir, un total de 96 Gb de Ram y 24 cores disponibles para ser usados por los usuarios de las formaciones que imparten nuestros amigos de StrateBI 

    Tutorial de Introduccion a Talend Open Studio

    $
    0
    0



    En este VideoTutorial podréis ver como funciona y conocer las principales características, pasos y  funciones de una de las mejores herramientas de integración de datos




    Además, los próximos 13 y 14 de Noviembre, se celebra en Madrid un Curso sobre Talend, no os lo perdáis



    Data Lakes: Definiciones y Plataformas. Descarga gratuita del White Paper

    $
    0
    0

    Un gran estudio de más de 40 páginas por parte de Philip Russom, que puedes descargar gratuitamente desde aquí




    Os dejo a continuación, un resumen de los contenidos y algunos de los principales hallazgos del estudio. Muy interesante.







    Para saber más de Data Lakes:


    Diferencias entre Data Lake y Data Warehouse



    Let’s briefly take a look at each one: Data. A data warehouse only stores data that has been modeled/structured, while a data lake is no respecter of data. It stores it all—structured, semi-structured, and unstructured. [See my big data is not new graphic. The data warehouse can only store the orange data, while the data lake can store all the orange and blue data.] Processing. Before we can load data into a data warehouse, we first...


    Sabes quién creó el término 'Data Lake'?



    What is a data lake? A data lake is a repository designed to store large amounts of data in native form. This data can be structured, semi-structured or unstructured, and include tables, text files, system logs, and more. The term was coined by James Dixon, CTO of Pentaho, a business intelligence software company, and was meant to evoke a large reservoir into which vast amounts of data can be poured. Business users of all kinds can dip into...


    Predictions: A Cynic’s Guide To BI In 2017



    Genial esta descripción de Timo Elliot (uno de los mayores especialistas en Business Intelligence). No tiene desperdicio!! Businesspeople Businesspeople will be dissatisfied with their BI systems (this is “Timo’s First Law of BI”) Executives will refuse to learn to use any other data tool than Excel (and not even the newer features of that). No matter how good the BI system, businesspeople will make bad decisions based on gut feel. Executives...


    Talend Big Data



    Download whitepaper An enterprise data lake provides the following core benefits to an enterprise: New efficiencies For data architecture through a significantly lower cost of storage, and through optimization of data processing workloads such as datatransformation and integration.  New opportunities For business through flexible “schema-on-read” access to all enterprise data, and through multi-use and multi-workload data processing on...


    OLAP for Big Data. It´s possible?



    Hadoop is a great platform for storing a lot of data, but running OLAP is usually done on smaller datasets in legacy and traditional proprietary platforms.   OLAP workloads are beginning to migrate to the one data lake that is running Hadoop and Spark. Fortunately, there are a number of Apache projects that are starting to make OLAP possible on Hadoop.  Apache Kylin For an introduction to this interesting Hadoop project, check...


    Big Data, casos, tecnologias y aplicaciones reales



    Os mostramos a continuación, una buena selección de ejemplos, tecnologías y casos aplicables de Big Data usando las principales tecnologías, con enfoque Data Lake, de la mano de los especialistas de stratebi ...






    Charla Introduccion Bases de Datos Analiticas (Vertica-MonetDB)

    $
    0
    0
    Si hace unos días, os dejábamos disponibles la charla de los Open Spaces sobre Real Time Big Data con Apache Storm y el de Apache Cassandra-NoSQL, hoy tenéis el video y la presentación del más que interesante de Bases de Datos Analíticas (orientadas a columnas).

    Estas bases de datos nos proporcionan un gran rendimiento en tiempos de consulta para grandes volúmes de datos en entornos analíticos, como son los cubos olap

    Si os es útil y os gusta, no dejéis de darnos feedback para continuar con nuevos materiales



    También disponible en slideshare:


    Viewing all 575 articles
    Browse latest View live