La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas. Y es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
Implica unificar estadísticas, análisis de datos, aprendizaje automático para comprender y analizar los fenómenos reales. Y emplea técnicas y teorías extraídas de las matemáticas, la estadística, la ciencia de la información, y la informática.
El ganador del premio Turing, Jim Gray, imaginó la ciencia de datos como un «cuarto paradigma» de la ciencia. Después del empírico, teórico y computacional; ahora vendría uno basado en datos.