Libros para adquirir conocimiento estadístico

Reseña y descarga de libros de conocimiento en estadística

Carolina Ramírez Patiño

5/18/202611 min read

Inspirado en mi amor por la divulgación científica y por cómo los datos pueden ayudarnos a entender el mundo desde la evidencia y no solo desde la intuición. La estadística y la analítica de datos no se aprenden únicamente resolviendo ejercicios: también se aprenden leyendo, cuestionando y entendiendo cómo los números cuentan historias.

Si quieres iniciar en este mundo —o fortalecer tus bases— aquí te comparto algunos de los mejores libros para aprender estadística, análisis de datos y pensamiento crítico, organizados desde un nivel introductorio hasta temas más avanzados.

Entendiendo la importancia de tener acceso a recursos de calidad, me complace ofrecerte la oportunidad de profundizar en estos temas. Contactándome directamente o ingresa a Telegram en los botones abajo, podrás acceder a los libros en formato PDF.

2017 | ESP

Esperanza de vida, tasa de siniestralidad, tablas, promedios… cada día recibimos centenares de datos estadísticos, a menudo sin tener las herramientas suficientes para analizarlos. El objetivo de este libro es ayudar al lector a desarrollar y fortalecer sus habilidades de análisis para que pueda evaluar con solvencia datos de este tipo y tomar decisiones sensatas en, por ejemplo, la contratación de seguros. Y el aprendizaje será Para Dummies, es decir, sin dolor ni sufrimiento.

2009 | ESP

SQL es un lenguaje de programación destinado a generar, manipular y recuperar información de una base de datos relacional. No depende de sí mismo, sino que lo invocan otros programas escritos en lenguajes de uso general, como por ejemplo C++, Java, Python y Perl. Uno de los motivos por el que estas bases de datos son tan populares es porque basándose en un diseño relacional adecuado, pueden llegar a gestionar grandes cantidades de datos. Si piensa trabajar con una base de datos relacional, ya sea escribiendo aplicaciones, llevando a cabo tareas administrativas, o generando informes, necesitará conocer cómo interactuar con la información de su base de datos. Incluso en el caso de que utilice una herramienta que genere sentencias SQL, habrá momentos en los que necesite obviar la función de generación automática y escribir sus propias sentencias SQL. Con este libro aprenderá cómo hacerlo. Esta guía de referencia le prepara rápidamente en SQL y es ideal para cualquiera que escriba aplicaciones, que realice tareas administrativas o que genere informes.

Storytelling con datos enseña los fundamentos de la visualización de datos para poder comunicar eficazmente con ellos. Aunque este libro está basado en la teoría, utiliza multitud de ejemplos del mundo real para que las pueda aplicar de forma inmediata en su siguiente gráfico o presentación. Narrar historias no es una habilidad inherente, especialmente cuando se trata de visualización de datos, y las herramientas de las que disponemos no facilitan las cosas. Este libro demuestra cómo ir más allá de las herramientas convencionales para llegar a la raíz de sus datos, y cómo utilizarlos para crear una historia atractiva, informativa y convincente.

2017 | ESP

Los siguientes recursos se encuentran disponibles, en la información puedes observar la portada, el año de publicación, el idioma en el cual se encuentra el libro en formato pdf (ESP - español y ENG - inglés) y la sipnosis. Si deseas adquirir alguno en físico puedes ingresar al enlace que te lleva al pasar el cursor por cada imagen.

2013 | ENG

Una Introducción al aprendizaje estadístico proporciona una visión general accesible del campo del aprendizaje estadístico, un conjunto de herramientas esenciales para dar sentido a los vastos y complejos conjuntos de datos que han surgido en campos que van desde la biología hasta las finanzas y el marketing y la astrofísica en los últimos veinte años. Este libro presenta algunas de las técnicas de modelado y predicción más importantes, junto con aplicaciones relevantes. Los temas incluyen regresión lineal, clasificación, métodos de remuestreo, enfoques de contracción, métodos basados en árboles, máquinas de vectores de soporte, agrupación, aprendizaje profundo, análisis de supervivencia, pruebas múltiples y más. Los gráficos en color y los ejemplos del mundo real se utilizan para ilustrar los métodos presentados. Dado que el objetivo de este libro de texto es facilitar el uso de estas técnicas de aprendizaje estadístico por parte de profesionales de la ciencia, la industria y otros campos, cada capítulo contiene un tutorial sobre la implementación de los análisis y métodos presentados en R, una plataforma de software estadístico de código abierto extremadamente popular. Dos de los autores co-escribieron The Elements of Statistical Learning (Hastie, Tibshirani y Friedman, 2a edición 2009), un libro de referencia popular para investigadores de estadística y aprendizaje automático. Una Introducción al aprendizaje estadístico cubre muchos de los mismos temas, pero a un nivel accesible a un público mucho más amplio. Este libro está dirigido tanto a estadísticos como a no estadísticos que desean utilizar técnicas de aprendizaje estadístico de vanguardia para analizar sus datos. El texto asume solo un curso previo de regresión lineal y sin conocimiento de álgebra de matriz. Esta segunda edición presenta nuevos capítulos sobre aprendizaje profundo, análisis de supervivencia y pruebas múltiples, así como tratamientos expandidos de Bayes ingenuos, modelos lineales generalizados, árboles de regresión aditiva bayesiana y finalización de la matriz. El código R se ha actualizado en todo para garantizar la compatibilidad.

2023 | ENG - ESP

SQL es un lenguaje de programación destinado a generar, manipular y recuperar información de una base de datos relacional. No depende de sí mismo, sino que lo invocan otros programas escritos en lenguajes de uso general, como por ejemplo C++, Java, Python y Perl. Uno de los motivos por el que estas bases de datos son tan populares es porque basándose en un diseño relacional adecuado, pueden llegar a gestionar grandes cantidades de datos. Si piensa trabajar con una base de datos relacional, ya sea escribiendo aplicaciones, llevando a cabo tareas administrativas, o generando informes, necesitará conocer cómo interactuar con la información de su base de datos. Incluso en el caso de que utilice una herramienta que genere sentencias SQL, habrá momentos en los que necesite obviar la función de generación automática y escribir sus propias sentencias SQL. Con este libro aprenderá cómo hacerlo. Esta guía de referencia le prepara rápidamente en SQL y es ideal para cualquiera que escriba aplicaciones, que realice tareas administrativas o que genere informes.

Para aprender de verdad ciencia de datos, no solamente es necesario dominar las herramientas (librerías de ciencia de datos, frameworks, módulos y kits de herramientas), sino también conviene comprender las ideas y principios subyacentes. Actualizada para Python 3.6, esta segunda edición de Ciencia de datos desde cero muestra cómo funcionan estas herramientas y algoritmos implementándolos desde el principio.

Si ya tiene aptitudes para las matemáticas y ciertas habilidades de programación, el autor, Joel Grus, le ayudará a familiarizarse con las mates y las estadísticas, que son el núcleo de la ciencia de datos, y con las habilidades informáticas necesarias para iniciarse como científico de datos. Repleto de nueva información sobre deep learning (aprendizaje profundo), estadísticas y procesamiento del lenguaje natural, este libro actualizado le muestra cómo sacar lo mejor de la sobreabundancia de datos que actualmente nos rodea.

2023 | ESP
2022 | ESP

Este libro está dirigido a científicos de datos familiarizados de algún modo con los lenguajes de programación R y/o Python, y con una formación básica (quizás irregular o efímera) a la estadística. Dos de los autores de este libro llegamos al mundo de la ciencia de datos desde el mundo de la estadística y apreciamos en cierta medida la contribución que la estadística puede hacer al arte de la ciencia de datos. Al mismo tiempo, somos muy conscientes de las limitaciones de la enseñanza de la estadística tradicional: la estadística como disciplina tiene un siglo y medio de vida, y la mayoría de los libros de texto y cursos de estadística están cargados con el impulso y la inercia de un transatlántico.

2013 | ENG

Escrito por reconocidos expertos en ciencia de datos Foster Provost y Tom Fawcett, Data Science for Business presenta los principios fundamentales de la ciencia de datos y lo guía a través del "pensamiento analítico de datos" necesario para extraer conocimientos útiles y valor comercial de los datos que recopila. Esta guía también le ayuda a comprender las muchas técnicas de minería de datos en uso hoy en día.

Basado en un curso de MBA que Provost ha impartido en la Universidad de Nueva York durante los últimos diez años, Data Science for Business proporciona ejemplos de problemas de negocios del mundo real para ilustrar estos principios. No solo aprenderá cómo mejorar la comunicación entre las partes interesadas de la empresa y los científicos de datos, sino también cómo participar de manera inteligente en los proyectos de ciencia de datos de su empresa. También descubrirá cómo pensar analíticamente los datos y apreciará plenamente cómo los métodos de ciencia de datos pueden respaldar la toma de decisiones empresariales. Comprenda cómo la ciencia de datos encaja en su organización, y cómo puede usarla para obtener una ventaja competitiva Trate los datos como un activo comercial que requiere una inversión cuidadosa si quiere obtener un valor real Enfoque problemas comerciales de forma analítica, utilizando el proceso de minería de datos para recopilar buenos datos de la manera más adecuada, Aprenda conceptos generales para extraer realmente el conocimiento de los datos Aplicar principios de ciencia de datos cuando entrevista a los candidatos a trabajo de ciencia de datos

Durante la última década se ha producido una explosión en computación y tecnología de la información. Con él han llegado grandes cantidades de datos en una variedad de campos como la medicina, la biología, las finanzas y el marketing. El desafío de comprender estos datos ha llevado al desarrollo de nuevas herramientas en el campo de la estadística y ha generado nuevas áreas como la minería de datos, el aprendizaje automático y la bioinformática. Muchas de estas herramientas tienen fundamentos comunes, pero a menudo se expresan con terminología diferente. Este libro describe las ideas importantes en estas áreas en un marco conceptual común. Mientras que el enfoque es estadístico, el énfasis está en los conceptos más que en las matemáticas. Se dan muchos ejemplos, con un uso liberal de gráficos en color. Es un recurso valioso para los estadísticos y cualquier persona interesada en la minería de datos en la ciencia o la industria. La cobertura del libro es amplia, desde el aprendizaje supervisado (predicción) hasta el aprendizaje no supervisado. Los muchos temas incluyen redes neuronales, máquinas vectoriales de soporte, árboles de clasificación y refuerzos, el primer tratamiento integral de este tema en cualquier libro. Esta nueva edición principal presenta muchos temas no cubiertos en el original, incluidos modelos gráficos, bosques aleatorios, métodos de conjunto, algoritmos de menor regresión de ángulo y trayectoria para el lazo, factorización de matriz no negativa y agrupamiento espectral. También hay un capítulo sobre métodos para datos amplios (p más grandes que n), incluyendo múltiples pruebas y tasas de descubrimiento falso. Trevor Hastie, Robert Tibshirani y Jerome Friedman son profesores de estadística en la Universidad de Stanford. Son investigadores destacados en esta área: Hastie y Tibshirani desarrollaron modelos aditivos generalizados y escribieron un libro popular de ese título. Hastie co-desarrolló gran parte del software de modelado estadístico y el entorno en R/S-PLUS e inventó las curvas y superficies principales. Tibshirani propuso el lazo y es coautor de la muy exitosa Introducción a la Bootstrap. Friedman es el co-inventor de muchas herramientas de minería de datos, incluyendo CART, MARS, búsqueda de proyección y aumento de gradiente.

2009 | ENG
2025 | ENG

La mayoría de los libros de texto sobre la regresión se centran en la teoría y el más simple de los ejemplos. Los problemas estadísticos reales, sin embargo, son complejos y sutiles. Este no es un libro sobre la teoría de la regresión. Se trata de usar la regresión para resolver problemas reales de comparación, estimación, predicción e inferencia causal. A diferencia de otros libros, se centra en cuestiones prácticas como el tamaño de la muestra y los datos faltantes y una amplia gama de objetivos y técnicas. Salta directamente a los métodos y el código de computadora que puede usar inmediatamente. Ejemplos reales, historias reales de la experiencia de los autores demuestran lo que la regresión puede hacer y sus limitaciones, con consejos prácticos para comprender los supuestos e implementar métodos para experimentos y estudios observacionales. Hacen una transición suave a la regresión logística y GLM. El énfasis está en la computación en R y Stan en lugar de derivaciones, con código disponible en línea. Los gráficos y la presentación ayudan a comprender los modelos y el ajuste del modelo.

2010 | ENG

Tomado literalmente, el título "Todas las estadísticas" es una exageración. Pero en espíritu, el título es apropiado, ya que el libro cubre una gama mucho más amplia de temas que un libro introductorio típico sobre estadísticas matemáticas. Este libro es para personas que quieren aprender la probabilidad y las estadísticas rápidamente. Es adecuado para estudiantes de posgrado o de pregrado avanzado en informática, matemáticas, estadística y disciplinas relacionadas. El libro incluye temas modernos como la estimación de curvas no paramétricas, el arranque y la clasificación de clase, temas que generalmente se relegan a cursos de seguimiento. Se presume que el lector conoce el cálculo y un poco de álgebra lineal. No se requiere conocimiento previo de probabilidad y estadística. Las estadísticas, la minería de datos y el aprendizaje automático se ocupan de recopilar y analizar datos. Durante algún tiempo, la investigación estadística se realizó en los departamentos de estadística, mientras que la minería de datos y la investigación del aprendizaje automático se realizaron en los departamentos de informática. Los estadísticos pensaban que los informáticos estaban reinventando la rueda. Los informáticos pensaban que la teoría estadística no se aplicaba a sus problemas. Las cosas están cambiando. Los estadísticos ahora reconocen que los científicos informáticos están haciendo nuevas contribuciones, mientras que los científicos informáticos ahora reconocen la generalidad de la teoría y metodología estadística. Los ritmos de algo de minería de datos inteligentes son más escalables de lo que los estadísticos creían posible. La teoría tística formal de la estación es más penetrante de lo que los científicos informáticos se habían dado cuenta.